搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
交流区
›
技术交流
›
gfs的数据一致性
0
4
0
分享
gfs的数据一致性
namewchwch
发表于 2013-10-16 13:38:43
[显示全部楼层]
阅读模式
关闭右栏
4
7247
About云VIP帮助找工作和提升
论文描述 client写数据 由pri-chunk返回所有chunk服务器上 chunk更新 状态。当有些 chunk更新失败 ,由client重新写尝试写 。
这种一致性不可靠吧,当有些 chunk更新失败时,client挂了 (断电 停机,或者其他的等等)这时候就产生了 chunk数据不一致。
这种数据一致性依赖于客户端的 健康 太不可靠了,求高手解释
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(4)人评论
电梯直达
正序浏览
namewchwch
发表于 2013-10-16 13:39:40
没有人能回答 ?
回复
使用道具
举报
显身卡
ruishenh
发表于 2013-10-16 13:40:17
说一下个人愚见,本人最近学习hadoop,可能理解有误,还望指出,就hadoop的本身会有一种心跳发送机制来看任务是否完成,还有数据验证功能,如果数据错误,它有可能会新启动一个job去完成这个,这个也会重新跑的,谁先跑完数据对,就会把非成功的所有job任务kill掉的,所以说当一个client失败了,会有其他的机器来启动这些任务,而且数据都是有分片的备份的。
回复
使用道具
举报
显身卡
namewchwch
发表于 2013-10-16 13:40:59
引用 2 楼 ruishenh 的回复:
说一下个人愚见,本人最近学习hadoop,可能理解有误,还望指出,就hadoop的本身会有一种心跳发送机制来看任务是否完成,还有数据验证功能,如果数据错误,它有可能会新启动一个job去完成这个,这个也会重新跑的,谁先跑完数据对,就会把非成功的所有job任务kill掉的,所以说当一个client失败了,会有其他的机器来启动这些任务,而且数据都是有分片的备份的。
我说的是 gfs 不是hadoop的 mapper reducer。对应是应该是 hdfs
回复
使用道具
举报
显身卡
namewchwch
发表于 2013-10-16 13:41:55
对于每一个chunk会产生一个CRC校验码,所以如果client挂掉是可以判断该chunk是否正确完成。
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
namewchwch
新手上路
关注
2
主题
8
帖子
3
粉丝
TA的主题
gfs的数据一致性
2013-10-16
24小时热文
字节三面过程,最终还是凉了
2024年求职攻略:掌握这4个习惯,迅速斩获
代码精进之路:从码农到工匠
eclipse搭建hadoop-3.1.2所需插件
2023年2月名企最新内推
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈