分享

请教:怎么使用mapreduce分析三列数据获取最大值

jack12138 发表于 2016-11-28 12:14:23 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 3 8524
这三列数据中,第一列数据比如说是客户,第二列的数据都是不相同的,比如说是商品,现在的需求是,怎么通过比较第三列数据(商品销售量)的大小然后找出最大值,得出的最后客户购买最多的商品包括及其对应的销售量。
1,a,2
1,b,12
1,c,56
1,d,3
1,e,4
2,f,12
2,g,9
3,h,5
4,i,78
4,j,96
4,k,54
5,l,32
5,m,18

已有(3)人评论

跳转到指定楼层
langke93 发表于 2016-11-28 14:34:11
进行一次对第三列全局排序即可

详细可参考这个,里面也有代码
【mapreduce进阶编程五】全局排序
http://www.aboutyun.com/forum.php?mod=viewthread&tid=9359


回复

使用道具 举报

yongjian3311 发表于 2017-3-15 18:11:14
对第三列进行排序,比如三列(a,b,c)
Map阶段自动排序 (k,v)= (c , a+' '+b)
回复

使用道具 举报

czwanglei 发表于 2017-3-17 11:22:11
二楼说的对,把c列作为key ,然后排序,输出
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条