用户组:游客
Hadoop平台没有提供全局数据排序,而在大规模数据处理中进行数据的全局排序是非常普遍的需求。本文首先实现简单的全局排序,然后再使用Hadoop平台提供的采样器解决数据倾斜的问题。 0.环境: hadoop2 ...
查看 »