用户组:游客
本帖最后由 Oner 于 2017-3-23 15:47 编辑 问题导读:1. 如何理解DStream?2. 如何理解DStreamGraph?3. Dstream中的transform ...
本帖最后由 水电费 于 2015-6-12 13:30 编辑 问题导读 1.流数据的处理过程有哪些? 2.Streaming是如何处理流式数据的? ...
有两种创建StreamingContext的方式: 第一种通过SparkConf [mw_shl_code=scala,true]val conf = new SparkConf().setAp ...
本帖最后由 pig2 于 2017-3-1 09:30 编辑 问题导读 1.spark主要包含哪几个模块? 2.spark各个模块作用是什么? 3.spark通信 ...
问题导航 1、Runtime是如何执行的? 2、DAGScheduler主要职能有哪些? 3、TaskScheduler主要职能有哪些? 4、SchedulerB ...
问题导读: 1.什么是Apache Oozie? 2.怎样定义工作流?3.怎样配置Oozie作业? Apache Oozie 是一个用于管理 ...
问题导读:1. RDD有哪些特性?2. 如何理解Application、Job、Stage、TaskSet以及Task?3. Spark如何实现可插拔式的资源管理模 ...
问题导读 1.spark2.0在引擎性能方面优化体现在什么方面? 2.spark2.0重构了哪些内容? 3.钨丝计划包含什么内容? ...
问题导读 1、如何减少批数据的执行时间? 2、Spark有哪些方面的性能优化? 3、有哪些错误我们需要关心? (一 ...
本帖最后由 pig2 于 2014-7-10 00:58 编辑 问题导读: 1、什么是Spark的All-In-One的解决方案? 2、有这么多大数据平台,我 ...
问题导读: 1. ELK 系统是如何进行架构的? 2. 为什么ELK 在 Spark 集群中是高可用性构架? 3. ELK 可以监控 Spark 集群的哪 ...
问题导读 1、RDD的依赖关系是什么? 2、spark和MapReduce的设计理念区别是什么? 概述 Spark Application在遇到 ...
问题导读 1.本文的问题背景是什么? 2.本文中问题有哪三种解决办法? 3.三个思路有什么不同? 软件版本及平台 ...
问题导读 1、RDD是什么? 2、为什么产生RDD? 3、RDD在spark是什么地位? 4、RDD在spark说是什么作用? 5、如何操作RDD? ...
本帖最后由 pig2 于 2017-1-25 10:11 编辑 问题导读:1.spark是什么?2.spark都需要安装什么软件?3.本地模式如何配置?4.集群 ...
本帖最后由 pig2 于 2014-3-5 02:15 编辑 本篇文章很重要,也是spark为什么是Spark原因: 1.Spark的核心是什么? 2.RDD在内 ...
问题导读: 1、如何理解在应用程序间、程序内调度? 2、集群的资源分配有哪些方式? 3、资源分配策略有哪些? 4、如何配置调 ...
问题导读 1.本文分析的日志格式什么样的? 2.如何通过代码实现的? 3.分析网页计分例子如何实现的? 本文首先对 Spa ...
本帖最后由 水电费 于 2015-6-19 16:26 编辑 问题导读 1.DataFream是如何创建的? 2.有哪些方法创建其接口? ...
本帖最后由 丫丫 于 2016-10-7 20:48 编辑 问题导读 1、shipyard是什么? 2、engine是什么? 3、rethinkdb是什么? 4、 ...
问题导读: 1、什么是DataFrames? 2、什么是DataFrames Schema? 3、Spark 1.2 Sql踩过的坑有哪些? 在spark sql 之 ...
问题导读 1.spark共享变量的作用是什么? 2.什么情况下使用共享变量? 3.如何在程序中使用共享变量? 4.广播变量源码包含 ...
问题导读: 1.什么是Zeppelin?2.Zeppelin有哪几种分享方式? 本篇文章着重介绍如何将您制作好的notebook / report ...
问题导读 1.SparkSession的功能有哪些? 2.如何创建SparkSession? 3.SparkContext在Spark中的主要功能有哪些? ...
Spark内核是由Scala语言开发的,因此使用Scala语言开发Spark应用程序是自然而然的事情。如果你对Scala语言还不太熟悉,可以阅读 ...
问题导读: 1. Spark2.0 有哪些新特性? 2. Spark2.0 API有哪些新特性? 3. Spark2.0 的速度为什么更快? 4. Structured St ...
本帖最后由 pig2 于 2016-7-25 14:17 编辑 问题导读 1.spark1.3及以前版本如何实现集群停止? 2.spark1.4采用以前版本方法 ...
本帖最后由 howtodown 于 2014-8-24 20:07 编辑 问题导读: 1.什么是Spark Streaming? 2.Spark Streaming可以接受那些数 ...
问题导读: 1、什么是广播变量和累加器? 2、Java和Scala如何实现? 一、广播变量和累加器 1.1 广播变量: 广播 ...
问题导读: 1.怎样利用Spark分析日志文件?2.Spark 属性配置方式有哪几种?3.Spark作业调度的基本工作流程是什么? S ...
本版积分规则 发表帖子
查看 »