分享

请问,如何调整map slot和reduce slot数目?使得最优??

jttsai 发表于 2014-12-10 19:12:08 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 5 13627
请问,如何调整map slot和reduce slot数目?使得最优??

已有(5)人评论

跳转到指定楼层
muyannian 发表于 2014-12-10 20:13:25

调优,目前还没有发现特定的规律,只能根据自己的环境和调优的原则来优化:
slot的理解如下:

  1. 1.在Hadoop中,计算资源是用槽位表示的。slot分为两种:Map  Slot和Reduce Slot。每种slot代表一定量的资源,且同种slot是同质的,也就是说,同种slot代表的资源量是相同的。管理员需要根据实际需要为TaskTracker配置一定数目的Map Slot和Reduce Slot数目,从而限制每个TaskTracker上并发执行的Map Task和Reduce Task的数目。
  2. 2.由于map slot和reduce slot不能在map task和reduce task之间共享(map slot只能供map task使用,reduce slot只能供reduce task使用),因此,当某一种类型任务对资源需求量而另外一种小时,会造成后一种资源浪费,为此,可根据集群map和reduce需求比例动态调整map slot和reduce slot数目
复制代码
知道他们两者的关系,然后我们优化的原则:

Map Task和Reduce Task调优的一个原则就是减少数据的传输量、尽量使用内存、减少磁盘IO的次数、增大任务并行数,除此之外还有根据自己集群及网络的实际情况来调优。



对于slot的优化,则是尽量的不要浪费资源,所以相信不断的调试,能够得出自己环境的正确答案。











回复

使用道具 举报

jttsai 发表于 2014-12-12 09:20:23
muyannian 发表于 2014-12-10 20:13
调优,目前还没有发现特定的规律,只能根据自己的环境和调优的原则来优化:
slot的理解如下:

那我如何评估当前集群map slot和reduce slot数目是是最优的啊?如果不是最优的,我如何确认map slot和reduce slot数目?
回复

使用道具 举报

jttsai 发表于 2014-12-12 11:16:23
muyannian 发表于 2014-12-10 20:13
调优,目前还没有发现特定的规律,只能根据自己的环境和调优的原则来优化:
slot的理解如下:

一个slot代表多少资源,比如多少cpu,多少内存?
回复

使用道具 举报

muyannian 发表于 2014-12-12 17:19:42
jttsai 发表于 2014-12-12 11:16
一个slot代表多少资源,比如多少cpu,多少内存?
reducer slots总数的计算公式如下:
Map slots总数=集群节点数×mapred.tasktracker.map.tasks.maximum
Reducer slots总数=集群节点数×mapred.tasktracker.reduce.tasks.maximum

slot好像已经取消了,详细参考
hadoop中什么是slots

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条