搜索
搜 索
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
›
日志
发布
日志
上传
相册
添加
分享
记录
日志
好友的日志
我的日志
随便看看
发表新日志
mahout
|
HADOOP_HDFS
|
HADOOP_MAPRED
|
hbase
|
数据挖掘的R实现
|
分享
fs -getmerge
maizhu
2014-10-20 10:15
可以通过以下命令把HDFS当中指定路径的多个文件,合并下载到本地当中 bin/hadoop fs -getmerge /user/foo/demofiles merged.txt
个人分类:
HADOOP_HDFS
|
451 次阅读
|
0
个评论
分享
设置replication factor
maizhu
2014-10-19 23:34
1、可以在$HADOOP_HOME/conf/hdfs-site.xml 设置 property namedfs.replication/name value2/value /property 2、也可以在上传文件的时候进行指定 bin/hadoop fs -D dfs.replication=1 -copyFromLocal non-critical- file.txt /use ...
个人分类:
HADOOP_HDFS
|
599 次阅读
|
0
个评论
分享
设置block的大小
maizhu
2014-10-19 23:28
hadoop中HDFS block的默认大小为64M,这个参数会影响到系统的性能,较大的值会带来更加优异的性能,在默认情况下,hadoop会为输入文件的每一个block创建一个map。 1、通过在 $HADOOP_HOME/conf/hdfs-site.xml 中的配置可以改变block的大小,不过不会改变已经存在的block的大小。单位为bytes property ...
个人分类:
HADOOP_HDFS
|
428 次阅读
|
0
个评论
分享
使用多个硬盘和限制硬盘的使用比例
maizhu
2014-10-19 23:18
hadoop支持为DataNode 的data设置多个存储的硬盘路径,hadoop将会向这些路径中均衡的写入数据,同时我们也可以通过设置限定硬盘的使用比例。 1、在每个硬盘或卷中创建数据的存储路径 2、在hdfs-site.xml文件中对dfs.data.dir进行如下配置 3、限制硬盘的使用比例,在 $HADOOP_HOME/conf/ hdfs-site.xml 进行如下 ...
个人分类:
HADOOP_HDFS
|
525 次阅读
|
0
个评论
分享
移除一个节点(Decommissioning DataNodes)
maizhu
2014-10-19 23:09
接下来将展示如何在不损失数据的前提下,从集群当中移除一个节点: 1、在namenode中创建一个新的文件,同时把这个文件包含到conf/hdfs-site.xml当中,配置如下 property namedfs.hosts.exclude/name value /value descriptionNames a file ...
个人分类:
HADOOP_HDFS
|
475 次阅读
|
0
个评论
分享
添加一个新的DataNode(Adding a new DataNode)
maizhu
2014-10-19 22:58
接下来将展示如何向一个hadoop集群中添加一个新的DataNode,以及如何强制HDFS进行数据的平衡 1、在新的节点上安装hadoop,同时把原来节点中的配置文件拷贝过来,可以使用rsync命令完成: rsync -a master_node_ip:hadoop-1.0.x/conf $HADOOP_HOME/conf 2、确保master node能够对新的节点实现免密码ssh登录, ...
个人分类:
HADOOP_HDFS
|
507 次阅读
|
0
个评论
分享
HDFS 基准测试(Benchmarking HDFS)
maizhu
2014-10-19 22:38
翻译自hadoop mapreduce cookbook 使用DFSIO对haoop集群的HDFS进行读写能力的测试,要 安装好hadoop,设置好HADOOP_HOME环境变量,benchmark的程序在$HADOOP_HOME/hadoop-*test.jar文件中 接下来的步骤将展示如何进行写入性能的测试: 1、执行如下命令,nrFiles 参数为文件的数量,fileSize为文件的个数 bin/h ...
个人分类:
HADOOP_HDFS
|
1911 次阅读
|
0
个评论
热度
1
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈