分享

TeraSort的取样算法

macWang 发表于 2017-7-11 09:56:48 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 1 5078
TeraInputFormat类中的writePartition方法中,对于取样的实现能不能来个大神讲解下,我啃过之后觉得有的难懂。谢谢!

已有(1)人评论

跳转到指定楼层
yuwenge 发表于 2017-7-11 14:30:04
不能只是简单的去阅读代码,时间长了,自己的代码,可能忘记。最好的阅读的方式是边调试边阅读,这样理解的准确性才够高。而且代码也都是有注释的。
另外对于取样,这个应该属于数据分析或则统计,最好具备这方面的专业知识,在理解方面,才会更准确。
对于提出的问题也比较笼统,相信别人讲解的话,也是一知半解。最好提出具体的问题。哪里不明白


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条