用户组:游客
本帖最后由 xioaxu790 于 2014-10-16 19:44 编辑 问题导读 1、你如何理解Spark的应用场景? 2、Spark的 "reduce"和MapReduce ...
问题导读: 1.怎样创建StreamingContext?2.怎样Spark Streaming处理数据?3.怎样解决从checkpoint目录读取应用信息,无法初 ...
问题导读: 1、用什么方式判断空RDD? 2、Spark Streaming与Kafka如何处理空RDD? 在Spark Streaming中,job不断的产生 ...
问题导读: 1.拿到数据我们怎么去做数据分析? 2.在spark中怎么去做聚类分析? 近期,comSysto公司分享了该公司研 ...
问题导读 1.本文中处理的数据量是多少? 2.Spark如何处理这些数据的? 3.Spark处理数据,作者做了哪些分析和讲解? 问 ...
Apache Spark的广播变量”(Broadcast variable)是什么? 两个文件/目录中的数据非常大,难以将某一个存放到内存中时,Spark如 ...
问题导读 1.编译spark源文件的过程中,如何防止内存不足? 2.spark如果没有自己hadoop或则hive版本对应的预构建版本,该如何 ...
问题导读: 1.Spark UI的处理流程是什么?2.这样分析现有Executors页面?3.怎样自己编写一个HelloWord页面? 前言有时 ...
需要注意两点:(1)使用的Hadoop必须是2.0系列,比如0.23.x,2.0.x,2.x.x或CDH4、CDH5等,将Spark运行在Hadoop上,本质上是将S ...
本帖最后由 pig2 于 2014-7-12 22:09 编辑 问题导读 1.Spark单点故障有几种解决方法? 2.基于文件系统的单点恢复适用于什么 ...
问题导读 1.Spark集群的执行单位是什么? 2.RDD的创建的来源是什么? 3.RDD之间是否可以转换? 4.如何实现修改spark WordC ...
问题导读 1、如何高效安装Spark分布式集群? 2、如何安装Hadoop集群和scala? 写在前面一: 本文详细总结Spark ...
本帖最后由 desehawk 于 2018-1-16 10:18 编辑 问题导读 1.Spark SQL在大规模数据集上遇到的哪些问题? 2.自适应执行的背 ...
阅读导读: 1.如何使用Scala编写一个对Apache访问日志的分析器? 2.如何在Linux命令行启动Spark? 3.如何确定一个URL访问页面 ...
本帖最后由 不会飞的小凯凯 于 2016-6-24 16:34 编辑 问题导读: 1.Spark和ElasticSearch怎么解决实时计算瓶颈? 2.Akka和El ...
问题导读: 1.Mongodb在Spark生态的角色?2.为什么要用MongoDB替换HDFS?3.怎样开发MongoDB Spark应用程序? ...
问题导读: 1.怎样进行数据可视化的预处理?2.怎样创建wordcloud?3.怎样进行tweets定位并在地图上显示? 对于 Pyt ...
问题导读: 1.maven编译spark应该注意什么问题? 2.spark在编译的时候,是否可以指定任意hadoop版本? ...
本帖最后由 pig2 于 2014-9-28 21:09 编辑 问题导读 1、如何方便、快速、有效得在Eclipse下编译打包Scala应用程序? 2、怎 ...
问题导读 1、idea上运行local的spark sql hive流程是怎样的? 2、如何安装配置安装 remote metastore? 3、如何解决org.apach ...
本帖最后由 xuanxufeng 于 2015-12-19 18:07 编辑 问题导读 1.Spark 随机森林算法原理是什么? 2.随机森林算法源码做了哪些 ...
问题导读 1、什么是MLlib? 2、什么方法默认执行L2正规化算法? 3、如何理解二元分类? MLlib是的Spark实现一 ...
本帖最后由 breaking 于 2016-3-10 21:59 编辑 问题导读: 1.spark调优有哪些配置项? 2.工作中怎么去自己调优? ...
问题导读1.spark shuffle都有哪些操作?2.本文spark shuffle分为哪两组任务?3.从1.1版本开始,Spark引入了“sort-based shuffle ...
问题导读: 1、与构建系统相关的actor和消息方面都有哪些? 2、actor系统4种主要的actor类型和两种专业的辅助actor类型是什么 ...
问题导读 1.数据处理效率的问题,Spark定义了API的接口,主要有哪3个方式? 2.Spark DataSource实现代码有哪三大类? 3.Gro ...
问题导读: 1、spark streaming 1.2 数据零丢失有什么特性? 2、数据可能丢失的场景都有什么? 3、spark streaming 1.3中使用 ...
问题导读 1.如何为zookeeper编写单元测试? 2.如何为Kafka编写单元测试? 3.如何为Spark编写单元测试? ...
问题导读: 1. 什么是无人驾驶模拟技术? 2. 无人驾驶汽车模拟器是什么?它的作用是啥?会面临哪些挑战? 3. ROS作在整个系统 ...
问题导读: 1、kafka是什么? 2、如何使用spark读取kafka中数据? 3、如何使用spark往kafka中写数据? 4、 如何处理端到 ...
本版积分规则 发表帖子
查看 »