分享

Hadoop常见 HA方案 及如何解决HA

第一部分:目前Hadoop1.0架构的问题
1.JPG

单点故障


•如果NameNode或者JobTraker关掉,那么整个集群瘫痪。
•对于7×24生产环境,是具有极大的风险。




第二部分:常见的HA方案
•第一种是可以设置一个NFS的目录,存储fsimage和editlog,存储的是实时数据,这样当namenode挂掉后能够通过fsimage和editlog进行完全恢复。
•第二种是设置Secondary Namenode。
•问题:不能迅速的切换,需要花费一定时间恢复。

FaceBook的方案


•不改变namenode和datanode整体逻辑的基础上,在其上层开发出AvaterNode,AvatarNode的意思就是支持互相切换。
•提供一个Primary Avatar和一个Standby Avatar,通过virual IP来设置IP地址。
•Primary Avatar对外提供服务,设置了NFS目录,将FSImage和EditLog远程存储。Standby Avatar将NFS目录中的FSImage和EditLog读取过来进行同步,并且设置Standby Avatar一直处于safemode状态,不影响正常操作。这样Standby Avatar相当于一个热拷贝,获得了所有的实时数据。




第三部分:Hadoop0.23 是如何解决的HA
2.JPG



•提供2台 机器做双机热备
•一台为Active 节点,一台为StandBy节点
•同时只有Active节点对外提供服务
•源数据存储在共享存储
•StandBy会时刻到共享存储拿Meta信息,以保证切换时不会丢掉数据
•DataNode会向2台机器汇报自己的信息
•仍需要配置Sencondary NameNode接解决Edits log变大问题





欢迎加入about云群425860289432264021 ,云计算爱好者群,关注about云腾讯认证空间

已有(1)人评论

跳转到指定楼层
acelearn 发表于 2017-4-11 10:44:55
谢谢楼主分享!!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条