分享

about云系列spark入门4:Spark Streaming介绍

问题导读

1.spark Streaming支持哪些语言?
2.spark Streaming是否具有故障恢复功能?





Spark Streaming使容易的建立可扩展的容错的流程序。

容易使用

Spark Streaming使用spark语言集成api处理流,使写流job跟批处理job是一样的。他支持Java, Scala and Python.

TwitterUtils.createStream(...)
    .filter(_.getText.contains("Spark"))
    .countByWindow(Seconds(5))



在滑动窗口中计算tweets

故障容错

Spark Streaming恢复丢失的job和状态,不需要额外代码

spark-streaming-recovery.png


Spark 集成

结合流与批处理和交互式查询。

运行spark和spark streaming是重用相同的代码,对于批处理, join streams,运行特定查询在流状态下,建立强大的交互式应用程序,不止是分析


上一篇:

about云系列spark入门3:Spark SQL处理结构化数据的spark模块



没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条