用户组:游客
本帖最后由 xuanxufeng 于 2017-4-4 15:03 编辑 问题导读 1.什么是KMeans? 2.KMeans算法可以用来做什么? 3.KMeans如何 ...
本帖最后由 pig2 于 2017-6-15 09:11 编辑 问题导读 1.Spark Streaming提供了哪三种内置的数据源支持? 2.Receiver的作用 ...
本帖最后由 pig2 于 2017-6-15 09:10 编辑 问题导读 1.DStreams的含义是什么? 2.DStreams提供哪两种类型的操作? 3.Tran ...
问题导读 1.rdd,dataframe,dataset在哪个版本被引入? 2.什么情况下使用rdd,dataframe,dataset? 3.它们有什么不同? ...
本帖最后由 Oner 于 2017-1-19 14:56 编辑 问题导读:1. 进行数据挖掘前需要了解哪些Spark基础?2. 什么是朴素贝叶斯算法?3 ...
本帖最后由 pig2 于 2016-11-24 20:51 编辑 问题导读 1.如何设置断点调试Scala? 2.如何注释Scala? 3.如何格式化代码? ...
问题导读 1.什么是Spark MLlib ? 2.Spark MLlib 分为哪些类? 3.KMeans算法的基本思想是什么? 4.Spark Mllib KMeans源码 ...
问题导读 1.spark中job、stage、task他们之间的关系是什么? 2.DAGScheduler的主要职能是什么? 3.DAGScheduler包含哪些st ...
本帖最后由 pig2 于 2015-3-9 02:43 编辑 问题导读 1.在Standalone部署模式下,Spark运行过程中会创建哪些临时性目录及文 ...
本帖最后由 xioaxu790 于 2015-2-6 22:17 编辑 问题导读 1、什么是Consumer Rebalance? 2、如何理解消息Deliver guarantee ...
问题导读 1、Spark技术有哪些热点? 2、如何更好的使用Tachyon? 3、Tachyon在百度实践中遭遇的挑战有哪些? 本文 ...
问题导读: 1.Scala函数参数传值调用? 2.Scala函数参数传名调用? 引言 Scala的解释器在解析函数参数(fun ...
问题导读: 1.Master如何根据启动参数决定不同重启策略? 2.CuratorFramework实现Zookeeper的高可用? ...
问题导读: 1.如何使用maven对Spark进行构建? 2.如何使用maven对Spark进行编译? 系统环境: 引 ...
问题导读: 1.基于文件系统的单点恢复实现Spark集群高可用? 2.基于zookeeper的Standby Masters实现Spark集群高可用? ...
问题导读 1、如何根据实际场合对Spark进行配置优化? 2、Storage相关配置参数有哪些? 随着Spark的逐渐成熟完善, ...
问题导读1.如何通过Parser把sql解析成一个LogicPlan?2.child.execute()执行子节点的execute来返回数据的过程是怎样的? ...
问题导读1.Spark与Hadoop MapReduce相比较有何优劣?2.如何使用Spark SQL分析数据? 去年网上曾放出个2000W的 ...
本帖最后由 pig2 于 2015-1-6 14:13 编辑 问题导读 1、如何直接将spark在yarn上面运行? 2、结合yarn,需要修改Hadoop哪些配 ...
问题导读 1、 in-memory 有哪些典型技术? 2、如何理解InMemoryColumnarTableScan在Catalyst中的作用? 3、怎样理解ColumnAcc ...
问题导读 1、Spark SQL有哪些函数类型? 2、如何理解Spark目前的UDF原理? 3、如何编写一个spark udf? 在SQL的世 ...
问题导读 1、如何理解 Spark Plan的4种操作类型? 2、joinRow的实现本质是什么? 3、什么是ShuffleHashJoin? 本 ...
本帖最后由 xioaxu790 于 2014-12-15 13:55 编辑 问题导读 1、什么是Physical Plan? 2、如何理解Optimizer工作流程? 3、 ...
问题导读 1、什么是Optimizer? 2、优化的主要策略总结起来是哪几大类? 3、如何理解Optimizer的工作方式? 本文 ...
本帖最后由 xioaxu790 于 2014-12-15 13:19 编辑 问题导读 1、Analyzer在Spark SQL里起到了什么作用? 2、如何理解流程是实 ...
问题导读 1、spark实验环境搭建流程是什么? 2、spark中job的生成和运行流程具体步骤是? 3、Spark布置环境中组件构成分 ...
本帖最后由 nettman 于 2015-1-6 14:07 编辑 问题导读 1、Spark部署和运行过程是怎样的? 2、RDD的组成部分和作用是什么? ...
本帖最后由 pig2 于 2015-3-9 02:42 编辑 问题导读 1.Spark-cassandra-connector的作用是什么? 2.CassandraRDDPartitioner ...
问题导读 1.spark-defaults.conf修改后,会造成哪些影响? 2.spark-env.sh中SPARK_MASTER_IP该如何指定? 3.spark-submit可 ...
问题导读 1.安装SparkR,需要哪些步骤? 2.如何使用SparkR来运行wordcount? 概要 ...
本版积分规则 发表帖子
查看 »