分享

急急急!HADOOP集群datanode下线问题

ltl_hit 发表于 2017-10-4 11:33:05 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 2 9198
各位好:
       集群中960台机器,现在下线43台,正在下线中有2台,我的步骤如下:
1、hdfs-site.xml和mapred-site.xml更改配置文件
2、填写exclude文件
3、hdfs dfsadmin –refreshNodes执行这条语句,每一台需要50分钟
然后状态下线图片:


QQ截图20171004112856.jpg
Decommissioning Nodes为2变为了0,数字2移动到了(Decommissioned: 2)了
但是Number of Under-Replicated Blocks还在变化,忽上忽下,变为0了之后,过一会儿刷新还变为有数字,特别奇怪,等待了好几天还是这样,不知道 我这两台到底下没下线成功?
是不是[size=14.6667px]hdfs dfsadmin –refreshNodes之后Live Nodes的那行Decommissioned增加了就代表下线成功了呢?现在比较迷糊

已有(2)人评论

跳转到指定楼层
desehawk 发表于 2017-10-4 13:11:42
看下退役的个数,另外到对应的datanode节点上,看看相关报告。
如查看下退役节点等
1.jpg
回复

使用道具 举报

ltl_hit 发表于 2017-10-4 13:19:10
desehawk 发表于 2017-10-4 13:11
看下退役的个数,另外到对应的datanode节点上,看看相关报告。
如查看下退役节点等

谢谢您的支持和答复,如果我没猜错的话,退役的个数是2,你标红的地方是Decommissioning Nodes,这个应该是正在退役的节点吧?Live NodesDead Nodes中的Decommissioned是真正退役后的吧?
你看我这个图 QQ截图20171004131703.jpg
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条