用户组:游客
问题导读 1.spark编程中print内容,在控制台是否能看到?2.输出的日志有哪两种?3.如何才能看到spark运行日志? 比如,Spark ...
问题导读:1.RDD支持哪些操作?2.什么是Shuffle?3.怎样用Scala写spark程序? RDD 操作介绍RDD 有两种操作方式的概念 ...
问题导读: 1.RDD是什么?2.如何选择存储级别?3.什么是并行集合? Spark 的一切都是建立在RDD这个抽象概念之上,而 ...
本帖最后由 xuanxufeng 于 2016-8-11 18:03 编辑 问题导读 1.Spark Streaming 的作用是什么? 2.Spark Streaming工作原理 ...
hbase-rdd二次开发 [*]创建: 张敏,最新修改: 昨天3:41 下午 hbase-rdd是一个构建在SparkContext基础之上的用于对 ...
本帖最后由 xuanxufeng 于 2016-6-9 14:21 编辑 问题导读 1.什么是dataset? 2.本文认为DataSet和RDD主要的区别是是什么? ...
问题导读: 1、Spark SQL操作流程有哪些? 2、如何加载/保存数据源? 3、保存模式有哪些? 首先看看从官网学习后总结 ...
本帖最后由 Oner 于 2016-6-3 08:37 编辑 问题导读: 1. Spark MLlib 在应用架构中的位置是怎样的? 2. Spark MLlib 算法可 ...
本帖最后由 howtodown 于 2016-5-16 16:50 编辑 问题导读 1.如何判断发生数据倾斜? 2.为什么会发生数据倾斜? 3.如何定 ...
问题导读: 1.什么是Parquet?2.Hbase怎样转换为Parquet? 列式存储布局(比如 Parquet)可以加速查询,因为它只检查 ...
问题导读: 1. JVM分为哪几种? 2. 如何监测垃圾回收? 3. 如何优化executor内存比例 4. 更高级的垃圾回收调优有哪些? ...
问题导读: 1.Spark调优有哪些原则?2.Spark作业原理是什么?3.怎样进行参数调优? 前言在大数据计算领域,Spark已 ...
本帖最后由 PeersLee 于 2016-4-13 19:01 编辑 问题导读: 1.Spark生态圈是否缺乏一个支持在线学习的流分析算法引擎? 2 ...
本帖最后由 breaking 于 2016-3-31 14:56 编辑 问题导读: 1.Spark Sql UDF怎么使用? 2.案例分析使用过程? S ...
问题导读: 1.Spark交互式Shell如何使用? 2.更多RDD操作有什么? 3.缓存机制是怎样的? 本文 ...
问题导读: 1.什么是Spark Streaming?2.怎样配置并运行Spark Streaming?3.怎样调优Spark Streaming? Spark Stream ...
问题导读: 1.怎样对DataFrame里面的数据进行采样?2.怎样查询DataFrame里面的数据?3.怎样将DataFrame保存成文件? 操作D ...
本帖最后由 wuyufei 于 2015-12-7 16:54 编辑 问题导读: 1.输入数据与预期结构是什么? 2.如何进行二进制和多标签分类? 3 ...
问题导读 1.本文认为SQLContext的作用是什么? 2.DataFrames对外DSL接口有哪些? 3.如何运行sql? Base on spar ...
问题导读: 1.Smack 4.1的改进有哪些?2.Smack 4.1的API变化有哪些? 一、Smack 4.1的主要改进 Smack 4.1.x最 ...
问题导读 1.spark job与RDD的关系是什么? 2.什么是Executor? 3.什么是Driver? 1.1 术语定义 [*]Applic ...
问题导读 1.在Topology中我们可以指定spout、bolt的并行度,在提交Topology时Storm如何将spout、bolt自动发布到每个服务器并 ...
GraphX 是 图 和 图并行计算的 Apache Spark's API 灵活性 图与集合无缝结合 图结合ETL,探索性分析,迭代图计算。 ...
易于使用 使用Java, Scala 和 Python. MLlib 适合 Spark's APIs 于使用Python NumPy 交互((开始于Spark 0.9).) ...
问题导读 1.spark Streaming支持哪些语言? 2.spark Streaming是否具有故障恢复功能? Spark Streaming使容易的 ...
问题导读 1.在spark程序中,如何使用spark sql? 2.spark对于不同的数据源是如何处理的? 3.spark sql是否支持 JDBC 和 ...
问题导读 1.spark安装包如何下载? 2.如何git下载源码包? 3.如果通过maven下载spark? 1.安装包下载 ...
本帖最后由 yuwenge 于 2015-6-2 20:59 编辑 问题导读 1.Spark on Yarn如何查看日志? 2.spark-env.sh文件的作用是什么? 3 ...
本帖最后由 yuwenge 于 2015-5-9 22:14 编辑 问题导读 1.什么是关联规则挖掘? 2.关联规则有哪些术语? 3.什么是FP-Growt ...
问题导读 1.sparkSQL中核心的组件是什么? 2.SchemaRDD组成都包含什么? 3.sparkSQL是否支持多种数据源? 4.spark SQL支持 ...
本版积分规则 发表帖子
查看 »