分享

思考之hadoop安全模式

hadoop安全模式
在分布式文件系统启动的时候,开始的时候会有安全模式,当分布式文件系统处于安全模式的情况下,文件系统中的内容不允许修改也不允许删除,直到安全模式结束。安全模式主要是为了系统启动的时候检查各个DataNode上数据块的有效性,同时根据策略必要的复制或者删除部分数据块。运行期通过命令也可以进入安全模式。在实践过程中,系统启动的时候去修改和删除文件也会有安全模式不允许修改的出错提示,只需要等待一会儿即可。SafeModeException 异常
运行hadoop程序时,有时候会报以下错误:
  1. org.apache.hadoop.dfs.SafeModeException: Cannot delete/user/hadoop/input. Name node is in safe mode.
复制代码
那我们来分析下这个错误,从字面上来理解:“Name node is in safe mode.”
现在就清楚了,那现在要解决这个问题,我想让Hadoop不处在safe mode 模式下,能不能不用等,直接解决呢?答案是可以的,

只要在Hadoop的目录下输入:

$bin/hadoop dfsadmin -safemode leave

也就是关闭Hadoop的安全模式,这样问题就解决了。

safemode模式

NameNode在启动的时候首先进入安全模式,如果datanode丢失的block达到一定的比例(1-dfs.safemode.threshold.pct),则系统会一直处于安全模式状态即只读状态。dfs.safemode.threshold.pct(缺省值0.999f)表示HDFS启动的时候,如果DataNode上报的block个数达到了元数据记录的block个数的0.999倍才可以离开安全模式,否则一直是这种只读模式。如果设为1则HDFS永远是处于SafeMode。
下面这行摘录自NameNode启动时的日志(block上报比例1达到了阀值0.9990)
The ratio of reported blocks 1.0000 has reached the threshold0.9990. Safe mode will be turned off automatically in 18seconds.

1.修改dfs.safemode.threshold.pct为一个比较小的值,缺省是0.999。
2. hadoop dfsadmin -safemode leave命令强制离开

hadoop dfsadmin-safemode 命令

格式:Usage: java DFSAdmin [-safemode enter | leave | get |wait]
用户可以通过dfsadmin -safemode value 来操作安全模式,参数value的说明如下:
enter - 进入安全模式
leave - 强制NameNode离开安全模式
get   - 返回安全模式是否开启的信息
wait  - 等待,一直到安全模式结束。

上面或许我们有了一个概念下面问题,我们是否想过?

系统在安全模式下干什么了?


当集群启动的时候,会首先进入到安全模式。系统在安全模式下,会检查数据块的完整性。假设我们设置的副本数(即参数dfs.replication)是5,那么在dataNode上就应该有5个副本存在,假设只存在3个副本,那么比率就是3/5=0.6。在配置文件hdfs-default.xml中定义了一个最小的副本率,见图7-1

图7-1
1.jpg

我们的副本率0.6明显小于0.999,因此系统会自动的复制副本到其他dataNode,争取是的最小副本率>=0.999。如果系统中有8个副本,超过我们设定的5个副本,那么系统也会删除多于的3个副本。

安全模式对我们有什么影响哪?

这时,不允许客户端进行任何修改文件的操作,包括上传文件、删除文件、重命名、创建文件夹等操作。比如,创建文件时,在源代码中就有对安全模式的判断,如图7-2
2.jpg


图7-2

当我们在安全模式下进行修改文件操作时,会报出如下错误,如图7-3

3.jpg

图7-3


正常情况下,安全模式会运行一段时间自动退出的。只需要我们稍等一会就可以了。到底等多长时间哪,我们可以通过50070端口查看安全模式退出的剩余时间,如图7-4。



4.jpg





图7-4


虽然不能进行修改文件的操作,但是可以浏览目录结构、查看文件内容的。


我们可以控制是否进入或者退出安全模式吗?


在命令行下是可以控制安全模式的进入、退出和查看的,


命令hadoop fs –safemode get 查看安全模式状态


命令hadoop fs –safemode enter 进入安全模式状态


命令hadoop fs –safemode leave 离开安全模式状态


操作如图7-5所示

5.jpg

图7-5


安全模式,是hadoop集群的一种保护机制,在启动时,最好是等待集群自动退出,然后再进行文件操作。






已有(1)人评论

跳转到指定楼层
pig2 发表于 2014-1-24 15:19:30
string2020 发表于 2014-1-24 11:26
既然安全模式是要做一些事情,如果此时,强制离开(hadoop fs –safemode leave)会出现什么后果

最严重 ...


其实我们的软件升级也有安全模式,是为了防止升级的过程中,对文件操作,干扰升级,造成升级失败,严重整个软件被破坏。所以hadoop的安全模式也是同样的道理,如想对hadoop文件上传,删除。则需要离开安全模式
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条