分享

map端数据倾斜

我最近在做hive优化,包括合并小文件,reduce段数据倾斜,设置压缩,最后发现有几个作业map阶段运行时间很长,定位问题在数据在各个节点上分布不均衡导致的,这种问题,大家有好的解决方案吗?感谢!

已有(2)人评论

跳转到指定楼层
langke93 发表于 2016-5-17 12:00:13
map端数据倾斜,楼主是否join操作了,如果是join操作可参考下面内容
hive数据倾斜原因分析及解决方案
http://www.aboutyun.com/forum.php?mod=viewthread&tid=8296




更多:

Hadoop(7)MapReduce 性能调优:减小数据倾斜的性能损失
http://www.aboutyun.com/forum.php?mod=viewthread&tid=15544


Hive数据倾斜(大表join大表)【优化】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=13077


【求助】关于HIVE数据倾斜的问题
http://www.aboutyun.com/forum.php?mod=viewthread&tid=10801


hive卡住不动,并非数据倾斜,这个是什么原因
http://www.aboutyun.com/forum.php?mod=viewthread&tid=10037



回复

使用道具 举报

zhuqitian 发表于 2016-5-17 13:47:01
很好的文章,多谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条