用户组:游客
问题导读 1.spark单独机器处理数据过大,会产生什么问题? 2.spark是否能支持复杂sql? 3.spark有未来哪些需要改进的地方 ...
问题导读 1、怎样部署在程序中调用spark服务的环境? 2、在程序中IDE中远程调用服务,需要做哪些配置? 3、JavaSparkContext ...
问题导读 1.spark如何增加CPU利用率? 2.partition是什么? 3.并行的executor的数量,有哪两种方式? 下面这些关 ...
本帖最后由 pig2 于 2015-12-14 21:23 编辑 问题导读: 1.基于 Spark 做 Spark Streaming 的思路是什么? 2.Spark Streami ...
本帖最后由 pig2 于 2014-7-11 00:52 编辑 问题导读: 1.spark是运行在什么平台的软件? 2.如何搭建开发环境? 3.spark调试 ...
问题导读 1.Spark是什么? 2.如何理解Spark? 3.Spark扩展了MapReduce的哪些方面? 4.Spark可与Hadoop生态系统哪些组件集成 ...
问题导读 1.spark-submit各个参数的含义是什么? 2.集群启动都包含哪些脚本? 3.如何实现连接一个应用程序到集群中? ...
本帖最后由 Oner 于 2016-11-7 14:25 编辑 问题导读:1. 为什么要选择Spark Streaming和Elasticsearch?2. 如何解决异常重启和 ...
本帖最后由 nettman 于 2015-1-21 10:30 编辑 问题导读 1、如何看待Spark生态系统? 2、为什么比MapReduce快呢? 3、如何走 ...
问题导读 1.本文讲了spark的那些优势? 2.淘宝使用spark来解决什么问题? 3.优酷土豆为什么使用spark? M ...
本帖最后由 yuwenge 于 2015-5-7 21:03 编辑 问题导读 1.分布式图计算框架的目的是什么? 2.图存储模式本文分为了哪两种? ...
问题导读: 1.如何使用 Spark Streaming 流计算?2.如何监控 Kafka 和 Spark Streaming?3.Spark Streaming 有什么不足 ...
问题导读 1.淘宝在Spark之上,主要做哪3个事情? 2.Spark给淘宝带来的好处是什么? 3.明风认为Spark 技术最适用于哪些应 ...
问题导读 1.spark有哪些使用场景? 2.spark有包含哪些组件? 3.spark在哪些厂商已经应用? 4.spark如何实现地震检测? ...
问题导读: 1.Spark Streaming在数据密集型应用中的位置在哪? 2.Spark Streaming 内部工作方式是什么样的? 3.Spark Streami ...
本帖最后由 howtodown 于 2014-7-16 11:37 编辑 问题导读:1.spark比mapreduce的优势是什么?2.为什么人们认为spark可能会取代 ...
问题导读 1.spark共享变量的作用是什么? 2.什么情况下使用共享变量? 3.如何在程序中使用共享变量? 4.广播变量源码包含 ...
问题导读 1、如何使用Python来分析数据文件? 2、如何理解Spark交互式分析? 1.1 Spark交互式分析 运行Spark脚本前 ...
问题导读 1.spark中job、stage、task他们之间的关系是什么? 2.DAGScheduler的主要职能是什么? 3.DAGScheduler包含哪些st ...
本帖最后由 xuanxufeng 于 2017-4-4 15:03 编辑 问题导读 1.什么是KMeans? 2.KMeans算法可以用来做什么? 3.KMeans如何 ...
问题导读 1.spark做了哪些改进? 2.本文认为spark与hadoop的关系是什么? Spark 1.2 发布,此版本包括 172 位贡 ...
问题导读 1.什么是Spark? 2.Spark生态系统包括哪些? 3.Spark的依赖有哪些? 4.了解Spark架构是怎样的? 5.Spark是如何运 ...
RDD(Resilient Distributed Datasets) ,弹性分布式数据集, 是分布式内存的一个抽象概念,RDD提供了一种高度受限的共享内存模型 ...
问题导读:1. RDD有哪些特性?2. 如何理解Application、Job、Stage、TaskSet以及Task?3. Spark如何实现可插拔式的资源管理模 ...
本帖最后由 InSight 于 2015-4-26 18:24 编辑 问题导读: 1.什么是Spark? 2.Spark的核心组件有哪些? 3.Spark整体架构如 ...
作为个人经验总结: 比如 RDD 缓存分布不均匀 是影响spark 的很大的性能之一,为什么这么说? spark调优是需要 ...
问题导读: 1.什么时候需要启用 checkpoint?2.如何使用 checkpoint?3.在什么时机进行 checkpoint? 一个 Streaming ...
问题导读 1、如何持久化流数据到内存中? 2、什么是Checkpointing? 3、如何监控应用程序? 本文接前篇: Spark ...
本帖最后由 howtodown 于 2015-3-24 16:34 编辑 问题导读 1.SQL语句在实际的运行过程中是怎么处理的呢? 2.sparkSQL的有哪 ...
本帖最后由 xuanxufeng 于 2015-12-2 17:08 编辑 问题导读 1.为什么说Spark 是对 MapReduce 模型的一种扩展? 2.mapre ...
本版积分规则 发表帖子
查看 »