用户组:游客
本帖最后由 不会飞的小凯凯 于 2015-11-20 16:17 编辑 问题导读: 1.什么是Spark微服务? 2.如何进行微服务实时性能 ...
问题导读: 1、怎样构建一个风控业务架构? 2、风控规则模型有哪些? 3、怎样实现Flink CEP 动态更新? 一、 ...
问题导读 1.SparkListener类的作用事什么? 2.Spark如果想监控各个任务的事件该如何实现? 3.阶段的事件监听接口类是哪个? ...
问题导读 1.本项目需求有哪些?2.类的入口是什么?3.各个需求是如何实现的? 代码下载:链接: https://pan.baidu.com/s/17IAal ...
问题导读: 1、Iceberg在实际的应用场景中会有什么收益? 2、Iceberg可以优化哪些流程? 3、Iceberg的数据读写流程是怎 ...
本帖最后由 PeersLee 于 2017-10-4 15:00 编辑 问题导读: 1. 如果将 Storm 替换为 Spark 那么业务实现流程是什么? 2. 如 ...
本帖最后由 levycui 于 2017-12-6 16:26 编辑 问题导读: 1、Spark SQL/DataFrame如何理解? 2、如何使用spark SQL编写统计 ...
问题导读 1.本文的场景是什么? 2.SparkSQL结合SparkStreaming,通过SQL实现实时计算数据统计需要做哪些准备? 3.SparkSQL ...
问题导读 1.尽量用reduceByKey,不要用groupByKey,为什么? 2.reduceByKey和groupByKey区别与用法? 3.如何实现去重? ...
问题导读 1.本文中处理的数据量是多少? 2.Spark如何处理这些数据的? 3.Spark处理数据,作者做了哪些分析和讲解? 问 ...
问题导读 1、如何基于用户协同过滤的?2、使用idea是如何打包的?3、UserBase推荐算法主要做哪些工作?4、如何运行jar?5、运 ...
本帖最后由 desehawk 于 2018-1-16 10:18 编辑 问题导读 1.Spark SQL在大规模数据集上遇到的哪些问题? 2.自适应执行的背 ...
本帖最后由 pig2 于 2018-9-3 20:03 编辑 问题导读 1.本文的环境是什么? 2.如何打断点? 3.查看变量的数据有几种方式? ...
问题导读: 1.使用Spark访问Hive表,读表数据导入到HBase有哪几种方式?2.怎样部署Spark集群?3.如何使用Spark读取Hive表数据 ...
问题导读:1. DBSCAN聚类算法是什么?2. 如何在Spark里使用PairRDDs?3. 如何在Spark中并发运行DBSCAN?4. 如何进一步增强地理定 ...
本帖最后由 Oner 于 2016-11-7 14:25 编辑 问题导读:1. 为什么要选择Spark Streaming和Elasticsearch?2. 如何解决异常重启和 ...
问题导读: 1.怎样最小化每个批数据的处理时间?2.怎样找出一个合适的batch间隔?3.当SparkStreaming应用程序发生故障时, ...
本帖最后由 PeersLee 于 2017-8-16 15:24 编辑 问题导读: 1. 如何选择ide? 2. 如何Build Spark? 3. 如何工程导入? 4 ...
本帖最后由 pig2 于 2014-9-28 21:09 编辑 问题导读 1、如何方便、快速、有效得在Eclipse下编译打包Scala应用程序? 2、怎 ...
问题导读: 1. Broadcast Join 如何实现? 2. Shuffle Hash Join 如何实现? 3. Sort Merge Join 如何实现? 引言 ...
问题导读: 1.如何使用spark查询特定范围的hbase的数据? 2.如何把hbase的数据转换成RDD? 3.如何组装scan对象? 最近 ...
本帖最后由 不会飞的小凯凯 于 2016-6-24 16:34 编辑 问题导读: 1.Spark和ElasticSearch怎么解决实时计算瓶颈? 2.Akka和El ...
问题导读: 1、kafka是什么? 2、如何使用spark读取kafka中数据? 3、如何使用spark往kafka中写数据? 4、 如何处理端到 ...
问题导读: 1.Mongodb在Spark生态的角色?2.为什么要用MongoDB替换HDFS?3.怎样开发MongoDB Spark应用程序? ...
本帖最后由 xuanxufeng 于 2015-12-19 18:07 编辑 问题导读 1.Spark 随机森林算法原理是什么? 2.随机森林算法源码做了哪些 ...
问题导读: 1.Kafka和Spark Steaming分别是什么?2.怎样搭建Kafka 集群?3.怎样使用 Kafka 和 Spark Streaming 构建实时数据 ...
本帖最后由 eying 于 2016-2-24 14:20 编辑 问题导读: 1.什么是Spark Streaming? 2.Spark Streaming如何在Hulu ...
问题导读: 1.怎样用IntelliJ IDEA开发多个项目? 2.开发多个项目过程中有哪些注意事项?3.多个项目之间的依赖关系是怎 ...
问题导读 1.本文如何实现读取Postgresql某一张表的数据为DataFrame? 2.如何写入Postgresql某张表中? 3.如何提交程序 ...
问题导读: 1、spark streaming任务日志遇到的问题有哪些? 2、spark streaming如何集中收集log? 3、如何配置apache log4j实 ...
本版积分规则 发表帖子
查看 »