用户组:游客
本帖最后由 nettman 于 2015-1-6 14:07 编辑 问题导读 1、Spark部署和运行过程是怎样的? 2、RDD的组成部分和作用是什么? ...
本帖最后由 pig2 于 2014-3-5 02:15 编辑 阅读本文章可以带着下面问题: 1.Spark基于什么算法的分布式计算(很简单) 2.Spar ...
问题导读: 1.Spark的适用场景是什么?2.spark 运行流程是怎样的?3.Spark Streaming的运行原理是怎样的? spa ...
问题导读 1.rdd,dataframe,dataset在哪个版本被引入? 2.什么情况下使用rdd,dataframe,dataset? 3.它们有什么不同? ...
问题导读 1、怎样搭建Kafka集群? 2、parser中的表达式分别代表什么意思? 3、你觉得应该如何运行KafkaWordCount呢? ...
本帖最后由 pig2 于 2016-11-24 20:51 编辑 问题导读 1.如何设置断点调试Scala? 2.如何注释Scala? 3.如何格式化代码? ...
问题导读 1.spark中job、stage、task他们之间的关系是什么? 2.DAGScheduler的主要职能是什么? 3.DAGScheduler包含哪些st ...
本帖最后由 xuanxufeng 于 2017-4-4 15:03 编辑 问题导读 1.什么是KMeans? 2.KMeans算法可以用来做什么? 3.KMeans如何 ...
问题导读 1.样例中是如何选择特征值作为分析依据的? 2.Spark Mlib是什么? 3.文章中建议学习Scala可以选择哪两本书? ...
本帖最后由 xioaxu790 于 2015-2-6 22:17 编辑 问题导读 1、什么是Consumer Rebalance? 2、如何理解消息Deliver guarantee ...
问题导读 1.如何获取样本数据? 2.如何使用Scala解析XML文件? 3.Scala解析XML文件需要导入依赖吗? 上一篇:Sp ...
本帖最后由 sunshine_junge 于 2014-7-7 21:51 编辑 问题导读: 1.什么是RDD? 2.如何实现RDD转换? 1、 ...
问题导读 1.如何将返回结果可视化? 2.如何对结果进行评估? 3.蒙特卡洛风险模拟可以用来做什么? 关注最新经典文章, ...
问题导读: 1.Scala函数参数传值调用? 2.Scala函数参数传名调用? 引言 Scala的解释器在解析函数参数(fun ...
本帖最后由 pig2 于 2017-6-15 09:10 编辑 问题导读 1.DStreams的含义是什么? 2.DStreams提供哪两种类型的操作? 3.Tran ...
问题导读 1.计算图中顶点之间的路径长度是什么样的过程? 2.什么是BSP?什么是Pregel? 3.GraphX中如何计算顶点之间路径长 ...
问题导读: 1.RDD的本质是什么?2.Shuffle的本质是什么?3.为什么Shuffle 容易导致Spark挂掉? 前言很多初 ...
本帖最后由 Oner 于 2017-1-19 14:56 编辑 问题导读:1. 进行数据挖掘前需要了解哪些Spark基础?2. 什么是朴素贝叶斯算法?3 ...
本帖最后由 pig2 于 2017-11-28 16:22 编辑 问题导读 1.你认为为何出现SparkSession? 2.SparkSession如何创建RDD? 3.Sp ...
问题导读 1、Spark技术有哪些热点? 2、如何更好的使用Tachyon? 3、Tachyon在百度实践中遭遇的挑战有哪些? 本文 ...
问题导读 1.本章主要目的有哪些? 2.什么是Avro? 3.现有的RPC框架有哪些?有何异同? 关注最新经典文章,欢迎关注公 ...
本帖最后由 Tank_2000 于 2017-5-4 21:16 编辑 问题导读: 1.spark-submit 命令都有哪些参数可以设置? 2.如何合理设置spa ...
问题导读 1.什么是Spark会话化?如何使用? 2.groupByKeyAndSortValues作用是什么,如何使用? 3.出租车地理数据分析的意义 ...
问题导读 1.什么是Spark MLlib ? 2.Spark MLlib 分为哪些类? 3.KMeans算法的基本思想是什么? 4.Spark Mllib KMeans源码 ...
问题导读: 1.基于文件系统的单点恢复实现Spark集群高可用? 2.基于zookeeper的Standby Masters实现Spark集群高可用? ...
本帖最后由 feilong 于 2018-8-3 09:50 编辑 问题导读 1.怎样做有助于我们了解网络整体结构? 2.Graphx是什么? 3.创建图 ...
本帖最后由 levycui 于 2019-6-19 19:54 编辑 问题导读: 1、如何理解RPC 网络通信抽象? 2、如何理解Spark 通信架构? 3、 ...
问题导读 1.什么是蒙特卡洛风险模型? 2.模型公式是什么? 3.文中从哪里获取股票数据? 关注最新经典文章,欢迎关注公 ...
问题导读 1.如何调优决策树? 2.怎样修正分类特征? 3.参数最大深度对决策树结果有何影响? 上一篇:Spark 高级分 ...
问题导读 1.推荐引擎是什么? 2.推荐引擎一般用来做什么?有什么样的实例? 3.什么样的数据是隐式反馈数据? ...
本版积分规则 发表帖子
查看 »