用户组:游客
问题导读 1、什么是MLlib? 2、什么方法默认执行L2正规化算法? 3、如何理解二元分类? MLlib是的Spark实现一 ...
问题导读1.spark shuffle都有哪些操作?2.本文spark shuffle分为哪两组任务?3.从1.1版本开始,Spark引入了“sort-based shuffle ...
问题导读: 1.Spark、Shark集群环境配置? 2.集群各种脚本写法? 1.部署环境 2.Spark集群 ...
问题导读 1.如何为zookeeper编写单元测试? 2.如何为Kafka编写单元测试? 3.如何为Spark编写单元测试? ...
本帖最后由 pig2 于 2015-4-1 21:47 编辑 问题导读 1.IBM如何使用Spark 技术的?带来了哪些好处? 2.本文spark有哪些应用场 ...
Spark Streaming实例分析 http://www.aboutyun.com/forum.php?mod=viewthread&tid=8901 Spark-Streaming实时大数据处理 ...
本帖最后由 坎蒂丝_Swan 于 2014-12-30 12:28 编辑 问题导读1.通常对象访问的速度都很快,但是为什么还需要2-5x的空间来存储 ...
问题导读: 1.spark-submit的作用是什么? 2.如何查看spark-submit的各种命令? 3.spark-submit提交spark应用程序应注意什么 ...
问题导读 1.Spark 1.4本文涉及了哪些函数? 2.随机数据生成函数的作用是什么? 3.为DataFrame新增加的数学函数本文介绍了 ...
问题导读 1、怎么设置Spark Streaming? 2、如何实现字符串解析? 3、怎样产生sessions? 这个 Spark Streaming 样 ...
问题导读 1.Spark streaming产生小文件的的原因是什么? 2.如何从原理角度去解决小文件? 3.如何从外部解决小文件问题? ...
问题导读: 1、spark streaming 1.2 数据零丢失有什么特性? 2、数据可能丢失的场景都有什么? 3、spark streaming 1.3中使用 ...
问题导读 1.Idea中红色字体代表什么含义? 2.灰色字体代表什么含义? 3.找不到相关包和函数原因是什么? 最新经典文章,欢 ...
问题导读: 1、与构建系统相关的actor和消息方面都有哪些? 2、actor系统4种主要的actor类型和两种专业的辅助actor类型是什么 ...
本帖最后由 breaking 于 2016-3-10 21:59 编辑 问题导读: 1.spark调优有哪些配置项? 2.工作中怎么去自己调优? ...
问题导读 1.spark1.3增加了哪些功能? 2.DataFrames可以用来做什么? 3.机器学习库Spark MLlib本文讲的实现了哪些新的学习 ...
问题导读 1.本文如何用450万条维基百科词条的文档集训练一个话题模型? 2.在线变分预测是一种什么技术? 3.对Spark LDA算 ...
问题导读 1.Spark SQL中的window API是哪个版本引入的? 2.本文通过什么例子解释了Window API的使用? Spark SQL ...
问题导读: 1.哪些案例体现的比较深刻? 2.如何进行动态编译? 3.如何进行分离项目方式? 解决方案: 我们知道 ...
问题导读: 1. 什么是无人驾驶模拟技术? 2. 无人驾驶汽车模拟器是什么?它的作用是啥?会面临哪些挑战? 3. ROS作在整个系统 ...
问题导读: 1. 如何使用IDEA? 2.用java编写spark程序? 3.Spark实现wordcount? 为了在IDEA中编写sca ...
问题导读 1.数据处理效率的问题,Spark定义了API的接口,主要有哪3个方式? 2.Spark DataSource实现代码有哪三大类? 3.Gro ...
问题导读1.Connection Refused可能原因是什么? 2.如何判断内存溢出,该如何解决? 扩展: 3.你认为/etc/hosts配置错误,会对 ...
本帖最后由 xuanxufeng 于 2015-12-19 18:07 编辑 问题导读 1.Spark 随机森林算法原理是什么? 2.随机森林算法源码做了哪些 ...
问题导读: 1、kafka是什么? 2、如何使用spark读取kafka中数据? 3、如何使用spark往kafka中写数据? 4、 如何处理端到 ...
问题导读: 1.如何使用spark查询特定范围的hbase的数据? 2.如何把hbase的数据转换成RDD? 3.如何组装scan对象? 最近 ...
问题导读: 1. Broadcast Join 如何实现? 2. Shuffle Hash Join 如何实现? 3. Sort Merge Join 如何实现? 引言 ...
问题导读 1、Spark的DAGScheduler是什么? 2、DAGScheduler的运行过程是怎样的? 3、如何理解Spark应用之间的调度? ...
本帖最后由 丫丫 于 2016-10-21 22:46 编辑 问题导读 1、如何定义图数据? 2、图数据分析与传统数据的处理有哪些不同之处? ...
问题导读: 1.RDD有哪些特性? 2.什么是计算抽象?3.Spark核心组件之间的交互流程是怎样的? Apache Spark是 ...
本版积分规则 发表帖子
查看 »