用户组:游客
本帖最后由 sstutu 于 2014-4-2 00:49 编辑 1.RDD是什么? 2.在Spark中有什么作用? 3.如何使用? 4.为什么会产生RDD? 5 ...
问题导读 1.Spark在YARN中有几种模式? 2.Yarn Cluster模式,Driver程序在YARN中运行,应用的运行结果在什么地方可以查看? ...
本帖最后由 pig2 于 2017-1-25 10:11 编辑 问题导读:1.spark是什么?2.spark都需要安装什么软件?3.本地模式如何配置?4.集群 ...
本帖最后由 howtodown 于 2014-8-24 20:07 编辑 问题导读: 1.什么是Spark Streaming? 2.Spark Streaming可以接受那些数 ...
问题导读 1、RDD是什么? 2、为什么产生RDD? 3、RDD在spark是什么地位? 4、RDD在spark说是什么作用? 5、如何操作RDD? ...
本帖最后由 pig2 于 2014-3-5 02:15 编辑 本篇文章很重要,也是spark为什么是Spark原因: 1.Spark的核心是什么? 2.RDD在内 ...
本帖最后由 pig2 于 2014-7-10 00:58 编辑 问题导读: 1、什么是Spark的All-In-One的解决方案? 2、有这么多大数据平台,我 ...
问题导读 1、RDD的依赖关系是什么? 2、spark和MapReduce的设计理念区别是什么? 概述 Spark Application在遇到 ...
问题导读 1.DataFrame是什么? 2.如何创建DataFrame? 3.如何将普通RDD转变为DataFrame? 4.如何使用DataFrame? 5.在1 ...
问题导读 1、如何减少批数据的执行时间? 2、Spark有哪些方面的性能优化? 3、有哪些错误我们需要关心? (一 ...
本帖最后由 Oner 于 2017-2-16 17:23 编辑 问题导读:1. Transformations 类的函数如何使用?2. Window Operations 类的函数如 ...
问题导读: 1.什么是sbt? 2.sbt项目环境如何建立? 3.如何使用sbt编译打包scala? sbt介绍 sbt是一个代码编 ...
本帖最后由 pig2 于 2014-4-29 19:04 编辑 问题导读: 1.Apache Spark三种部署方式哪一种更适合Apache Spark? 2.Spark在sta ...
问题导航 1、Runtime是如何执行的? 2、DAGScheduler主要职能有哪些? 3、TaskScheduler主要职能有哪些? 4、SchedulerB ...
问题导读 1.什么是DataFrame? 2.在大数据分析方面spark Sql 提供了哪些助力? 3.Spark 支持哪些数据源? 4.DataFrame有 ...
本帖最后由 pig2 于 2017-3-1 09:30 编辑 问题导读 1.spark主要包含哪几个模块? 2.spark各个模块作用是什么? 3.spark通信 ...
本帖最后由 hyj 于 2014-5-4 19:01 编辑 问题导读: 1.由不同线程提交的多个“jobs”(Spark actions)是否可以同时运行 2. ...
本帖最后由 PeersLee 于 2017-5-3 11:42 编辑 问题导读: 1. 堆内和堆外的内存如何规划? 2. 内存空间如何分配? 3. 存储内 ...
问题导读: 1.如何在Spark的伪分布模式下运行? 2.Driver可以运行在哪里? 3.Standalone模式有什么特点 Local模式 运行 ...
问题导读 1.如何下载spark源码? 2.如何将源码导入eclipse中? 一、准备工作1、到官方网站下载:Openfi ...
本帖最后由 丫丫 于 2017-2-6 18:38 编辑 问题导读 1、RDD是什么? 2、如何创建RDD? 3、什么是mapPartitions? 4、什么 ...
问题导读 1.什么是Spark Package? 2.本文spark Package各自的作用是什么? 假如这个库能持续的发展下去,从 ...
本帖最后由 hero1122 于 2017-6-12 19:02 编辑 问题导读: 1.spark如何进行堆内内存规划? 2.spark如何进行堆外内存规划? ...
问题导读 1.spark共享变量的作用是什么? 2.什么情况下使用共享变量? 3.如何在程序中使用共享变量? 4.广播变量源码包含 ...
问题导读 1、TDW Spark与MapReudce有哪些不同? 2、传统的MapReduce/Pig类框架存在着哪方面严重的性能问题? 3、你如何理解T ...
问题导读: 1.lambda架构原理是什么? 2.Hulu怎么进行数据收集? 3.怎么样监控数据? 在流式计算领域,Spark Streaming和 ...
问题导读: 1.如何使用 Spark Streaming 流计算?2.如何监控 Kafka 和 Spark Streaming?3.Spark Streaming 有什么不足 ...
问题导读 1.什么是spark stage? 2.stage如何划分? 3.Spark 多个Stage执行是串行执行的么? 什么是spark s ...
问题导读:1. RDD有哪些特性?2. 如何理解Application、Job、Stage、TaskSet以及Task?3. Spark如何实现可插拔式的资源管理模 ...
问题导读: 1.什么时候需要启用 checkpoint?2.如何使用 checkpoint?3.在什么时机进行 checkpoint? 一个 Streaming ...
本版积分规则 发表帖子
查看 »