立即注册 登录
About云-梭伦科技 返回首页

starrycheng的个人空间 https://www.aboutyun.com/?1310 [收藏] [复制] [分享] [RSS]

日志

关闭DataNode前HDFS的调优

已有 1470 次阅读2016-6-29 22:07

配置CDH和管理服务

关闭DataNode前HDFS的调优

角色要求:配置员、集群管理员、完全管理员

 

当一个DataNode关闭,NameNode确保每一个DataNode中的每一个块根据复制系数(the replication factor)跨集群仍然是可用的。这个过程涉及到DataNode间小批次的块复制。在这种情况下,一个DataNode有成千上万个块,关闭后集群间还原备份数可能需要几个小时。关闭DataNode的主机之前,你应该首先调整HDFS:

 

1提高DataNode的堆栈大小。DataNode应该至少有4 GB的堆栈大小,以允许迭代的增加和最大的流

    a去HDFS服务页面;

    b单击配置(Configuration)选项卡;

    c在每个DataNode角色组(DataNode默认组和额外的DataNode角色组)去资源管理(ResourceManagement)类别,并设置DataNode的Java堆栈大小(字节)(Java Heap Size of DataNode in Bytes)

    d、点击保存更改(Save Changes提交更改。

 

2设置DataNode平衡带宽

    a展开DataNode默认组(DataNode Default Group) > 性能(Performance)类别;

    b根据你的磁盘和网络性能配置DataNode平衡带宽(DataNode Balancing Bandwidth

c点击保存更改(Save Changes提交更改。

 

3提高依据迭代设置复制工作乘数器的数值(默认值是2,然而推荐值是10)

    a展开NameNode默认组(NameNode Default Group) >高级(Advanced)类别;

    b将配置依据迭代设置复制工作乘数器(Replication Work Multiplier Per Iteration)设置为10

c点击保存更改(Save Changes提交更改。

 

4增加复制的最大线程数和最大复制线程的限制数

    a展开NameNode默认组(NameNode Default Group) >高级(Advanced)类别;

    b配置Datanode复制线程的最大数量(Maximumnumber of replication threads on a Datanode)和Datanod复制线程的数量的限制数(Hardlimit on the number of replication threads on a Datanod)分别为50和100;

    c点击保存更改(Save Changes提交更改。

 

5重新启动HDFS服务。



路过

雷人

握手

鲜花

鸡蛋

评论 (0 个评论)

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 立即注册

关闭

推荐上一条 /2 下一条