用户组:游客
问题导读 1.spark-defaults.conf修改后,会造成哪些影响? 2.spark-env.sh中SPARK_MASTER_IP该如何指定? 3.spark-submit可 ...
本帖最后由 pig2 于 2015-3-9 02:42 编辑 问题导读 1.Spark-cassandra-connector的作用是什么? 2.CassandraRDDPartitioner ...
问题导读 1.安装SparkR,需要哪些步骤? 2.如何使用SparkR来运行wordcount? 概要 ...
问题导读 1、你如何理解转换(Transformations)的含义? 2、Spark实现机器学习算法的流程有哪些? 3、如何利用已有的训练样本 ...
问题导读 1、你如何理解Spark的基本架构和重要模块? 2、Spark分为哪几个主要的子模块? 3、Spark采用了什么设计方式和整体架 ...
本帖最后由 xioaxu790 于 2014-10-21 17:46 编辑 问题导读 1、如何理解Spark的fold操作? 2、如何该action的功能? 3、什么 ...
问题导读 1、利用Spark将json文件导入Cassandra的前提条件有哪些? 2、本次实验需要结合哪些知识? 3、进行数据导入时,需要 ...
问题导读 1、怎样创建可以连接到cassandra的sc? 2、如何添加相应的library来支持spark-cassandra-connector? 3、最简单的配 ...
本帖最后由 52Pig 于 2014-10-11 22:47 编辑 阅读导读: 1.SparkContext创建TaskScheduler和DAG Scheduler? 2.TaskSchedule ...
问题导读: 1.Job的提交过程主要经过哪些对象的处理? 2.Dependency类的作用是什么?它包含哪些对象? 3.分析下DAGScheduler ...
本帖最后由 pig2 于 2014-10-4 23:47 编辑 阅读导读: 1.TaskScheduler的工作原理是什么? 2.TaskScheduler与SchedulerBacke ...
本帖最后由 pig2 于 2014-10-4 23:42 编辑 问题导读 1.Standalone部署方式包含哪些组件?2.driver启动包含哪些过程?3.Worker ...
本帖最后由 pig2 于 2014-9-14 12:43 编辑 问题导读 1、如何保存接收到的数据? 2、如何处理接收到的数据? 3、调用getOrCo ...
本帖最后由 pig2 于 2014-9-14 12:40 编辑 问题导读 1、yarn提交作业的流程是怎样的? 2、run方法在ApplicationMaster里面主 ...
问题导读 1、如何理解spark的环境变量传递? 2、Task的派发源起于什么? 上一篇中介绍了Spark的各种运行模式的基本 ...
本帖最后由 xioaxu790 于 2014-8-13 07:43 编辑 问题导读 1、spark大致工作流程是什么? 2、Spark的运行模式取决于什么? 3 ...
问题导读 1、Spark支持哪些共享变量? 2、如何操作累加器? Spark的第二个抽象,是并行计算中使用的共享变量。一般来 ...
问题导读 1、storage模块分为哪两个层面? 2、通信层中类结构所扮演的不同角色关系是什么? 3、如何交互存取block? ...
问题导读 1、Spark更加有效率运行的原理是什么? 2、如何理解转换、动作? 分布式数据集支持两种操作: 转换(transf ...
本帖最后由 pig2 于 2015-3-19 22:23 编辑 问题导读 1、RDD程序的调试工具是什么? 2、如何学习可迭代的机器应用? ...
本帖最后由 pig2 于 2015-3-19 22:24 编辑 问题导读 1、什么是Pregel容错? 2、如何实现RDD的在迭代计算? 摘要 本 ...
本帖最后由 xioaxu790 于 2014-7-18 19:16 编辑 问题导读 1、如何理解SQL Core? 2、RDD支持的第三方格式有哪些? 3、SQLCo ...
本帖最后由 xioaxu790 于 2014-7-18 19:24 编辑 问题导读 1、什么是Catalyst? 2、对Hive的兼容支持将转移到什么上? 3、Tr ...
问题导读: 1.python开发Spark Application拥有哪些优势? 2.sogou日志数据分析python如何实现的? 3.Spark1.0.0的Python程 ...
本版积分规则 发表帖子
查看 »