分享

hadoop最新面试题概念及对hadoop理解

rsgg03 发表于 2015-3-20 00:35:26 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 6 18230
1. 简述HDFS的组成和工作原理。

2. 说说你参与的大数据产品,以及设计和开发过程中,需要注意、避免和强化的一些问题。

3. Hadoop项目管理人Tom White说:硬盘寻道时间每年大约提高5%,硬盘数据传输率则提高20%,寻道时间的进步比数据传输率慢,所以采用由数据传输率决定性能的模型是有利的。 请解释你对这段话的理解,在实际中我们如何应用它。

搜集自qq群


欢迎大家如about云官方群371358502,更新咨询,更新资源,随时关注

已有(6)人评论

跳转到指定楼层
plist 发表于 2015-3-20 10:17:29
这段话,不是很理解
回复

使用道具 举报

langke93 发表于 2015-3-20 11:26:41



  1. 本质上,在MapReduce的工作方式中,数据流式地读出和写入硬盘,MapReduce是以硬盘的传输速率不断地对这些数据进行排序和合并。 与之相比,访问关系数据库中的数据,其速率则是硬盘的寻道速率(寻道指移动磁头到盘面上的指定位置读取或写入数据的过程)。为什么要强调这一点?请看看寻道时间和磁盘传输率的发展曲线。寻道时间每年大约提高5%,而数据传输率每年大约提高20%。寻道时间的进步比数据传输率慢——因此采用由数据传输率决定性能的模型是有利的。MapReduce正是如此。
复制代码
上面出自这个文档
链接:http://pan.baidu.com/s/1jG036WA 密码:e4qg
回复

使用道具 举报

tianhao960 发表于 2015-3-28 18:22:59
应该就是说,尽量少寻道,而要依赖数据传输速率,多顺序读写。
回复

使用道具 举报

gf84 发表于 2015-6-7 00:32:41
好资料,学习下,谢谢共享
回复

使用道具 举报

gf84 发表于 2015-6-7 00:33:14
好资料,学习下,谢谢共享
回复

使用道具 举报

gf84 发表于 2015-6-7 11:45:39
好资料,学习下,谢谢共享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条