分享

spark数据清洗问题

smfswxj 发表于 2017-12-2 22:15:58 [显示全部楼层] 只看大图 回帖奖励 阅读模式 关闭右栏 3 6380
下载.png
用什么函数可以是的kbdoc-00001只对应一个值了


已有(3)人评论

跳转到指定楼层
langke93 发表于 2017-12-2 22:24:07
尝试distinct()
.distinct().take(4)

回复

使用道具 举报

smfswxj 发表于 2017-12-3 08:58:44
langke93 发表于 2017-12-2 22:24
尝试distinct()
.distinct().take(4)

这种方法我用过,没用


回复

使用道具 举报

smfswxj 发表于 2017-12-3 11:04:38
t.map(lambda l:l.split(":")).reduceByKey(lambda x, y: y).sortByKey().collect()
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条