用户组:游客
1.广播为什么能提升性能?2.什么样的情景下需要广播? 3.广播可能会遇到哪些问题? 有时在开发过程中,会遇 ...
sparkstreaming 读取kafka日志数据,窗口处理为1分钟,日志数据自带时间戳,想根据日志时间戳进行分钟级别的数据统计,这个怎么 ...
现在有个数据表:店铺 订单 sku详情(sku编号:数量) xxx旗舰店 ECO001 [SKU1:8,sku2:3,sku3:5] xxx旗舰店 ...
感谢您,点进来,作为学校第一届大数据相关专业,导师对于毕业设计题目也没有什么眉头,请求各位探讨一些方案,离线的项目太过简 ...
用spark-submit 提交任务之后,怎么监测任务的运行状态呢,运行了百分比和最后是否运行成功,在spark-submit提交之后会出现一些 ...
spark从hdfs上读取parquet文件,我是这么实现的val rdd = context.sql("xxxxx").orderBy("xx").rdd rdd.saveAsTextFile("xxxxx") ...
应用场景: 间隔一个时间段来一次数据,使用spark做数据的清洗。有效数据写到hive表中,但是有一部分数据只有开始,结束 ...
本版积分规则 发表帖子
查看 »