分享

如何利用Spark Streaming实现UV(有状态的)统计

xingoo 发表于 2017-5-9 10:51:36 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 10 32687
xingoo 发表于 2017-6-4 09:53:44
zstu 发表于 2017-6-2 16:59
楼主,你是怎么用checkpoint来计算uv的,可以代码共享一下吗?

这个可以参考Spark官方提供的例子,我这里不方便公布代码:
https://github.com/apache/spark/ ... workWordCount.scala

https://github.com/apache/spark/ ... workWordCount.scala



基本的思路就是:
1 设置检查点
2 getorcreate创建context
3 如果需要保存状态,可以使用mapWithState

回复

使用道具 举报

12
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条