用户组:游客
问题导读: 1.说一下spark调度机制? 2.Spark的调度框架是否支持并行提交多个job? 3.思考下在非自适应与自适应情况下SQL的并 ...
问题导读 1.为什么会出现Spark? 1.1 什么是hadoop? 1.2 什么是MapReduce计算模型? 1.3 Spark比Mapreduc ...
问题导读 1.什么是spark stage? 2.stage如何划分? 3.Spark 多个Stage执行是串行执行的么? 什么是spark s ...
本帖最后由 Oner 于 2017-2-16 17:23 编辑 问题导读:1. Transformations 类的函数如何使用?2. Window Operations 类的函数如 ...
问题导读: 1.HashShuffleManager 运行原理是什么? 2.SortShuffleManager 运行机制及其原理是什么? 3.shuffle 相关参数如 ...
问题导读 1.HBase Connector是用来干什么的? 2.Catalog的作用是什么? 3.HBase Connector该如何使用? 在github上有一 ...
问题导读 1.DataFrame是什么? 2.如何创建DataFrame? 3.如何将普通RDD转变为DataFrame? 4.如何使用DataFrame? 5.在1 ...
问题导读 1、如何了解Spark的功能? 2、什么是Spark aggregate? Spark的官方文档其实说得并不是明了,很多内容如果 ...
问题导读 1.为什么要在Kubernetes上运行Kafka? 2.Kafka在Kubernetes需要注意哪些问题? 3.在Kubernetes上的部署Kafka时, ...
问题导读 1.Spark2入门是哪个类? 2.为何要产生Spark-Session? 3.Spark-Session如何使用? 关注最新经典文章,欢迎关注公 ...
问题导读 1.从哪个版本开始Elasticseach支持spark sql? 2.如何查找Elasticseach和spark sql对应版本? 3.如何实现Spark S ...
问题导读 1. 分布式矩阵是什么? 2. 在Spark中如何使用分布式矩阵? 3. 使用分布式矩阵的坑? 关注最新经典文章,欢 ...
问题导读 1.Spark MLFlow用来做什么的? 2.MLFlow解决了什么问题? 3.MLFlow哪些问题未解决? MLflow 是由Apache ...
内容整理自7群 CAM和Phineas 对于下面代码,运行产生问题 exception in thread"main" org.apache.spark.SparkEx ...
本帖最后由 sstutu 于 2014-4-2 00:49 编辑 1.RDD是什么? 2.在Spark中有什么作用? 3.如何使用? 4.为什么会产生RDD? 5 ...
本帖最后由 hero1122 于 2017-6-12 19:02 编辑 问题导读: 1.spark如何进行堆内内存规划? 2.spark如何进行堆外内存规划? ...
问题导读:1. Spark 中的 Transform 和 Action 区别是什么?2. foreachPartition 属于Transform 和 Action中的哪种操作?3. mapP ...
本帖最后由 pig2 于 2017-12-15 18:11 编辑 问题导读 1.spark2 sql如何读取json文件? 2.spark2读取json格式文件有什么要 ...
问题导读 1.spark如何开启黑名单机制? 2.哪些条件将executors列入黑名单? 3.整个节点被列入黑名单,executors如何处理? ...
问题导读 1、涉及shuffle的操作有哪些? 2、如何理解combineByKey的操作流程? 3、flatMapValues作用是什么? 主 ...
本帖最后由 pig2 于 2017-3-2 15:52 编辑 问题导读 1.你认为缓存的作用是什么? 2.cache与persist的区别是什么? 3.spark ...
本帖最后由 sehriff 于 2017-9-27 23:06 编辑 问题导读 1.什么是CBO,RBO?2.什么是执行计划?3.什么是join,filter?4.事实表 ...
问题导读: 1.in-heap 和 off-heap (MemoryAllocator)是什么? 2.内存管理器(MemoryManager)介绍? 3.ExecutorMemoryManager ...
问题导读: 1.ListenerBus 是如何工作的? 2.ListenerBus 做了什么? 3.MetricsSystem 是如何工作的? 4.如何配置MetricsSys ...
问题导读 1.新版scala插件有啥改进? 2.什么是隐式转换? 今年夏天,我们很高兴地宣布了Scala插件一些新功能和改进。 ...
问题导读: 1.RDD具有哪些重要的特性?2.Spark支持哪些集群模式?3.在Standalone模式下,核心组件是怎样交互的? ...
本帖最后由 丫丫 于 2017-2-6 18:38 编辑 问题导读 1、RDD是什么? 2、如何创建RDD? 3、什么是mapPartitions? 4、什么 ...
问题导读: 1.怎样编译和配置HIVE? 2.怎样配置spark?3.怎样开发spark? 小结结构上Hive On Spark和SparkSQL ...
本帖最后由 levycui 于 2016-10-11 14:53 编辑 问题导读: 1、如何使用Spark shell进行Spark ALS算法实现? 2、如何理解ALS算 ...
本帖最后由 PeersLee 于 2017-5-3 11:42 编辑 问题导读: 1. 堆内和堆外的内存如何规划? 2. 内存空间如何分配? 3. 存储内 ...
本版积分规则 发表帖子
查看 »