用户组:游客
问题导读 1、Spark如何快速上手? 2、如何运行你的Spark 应用程序? 3、学习Spark,你有怎样的见解? 快速上手 ...
本帖最后由 Oner 于 2016-11-7 14:25 编辑 问题导读:1. 为什么要选择Spark Streaming和Elasticsearch?2. 如何解决异常重启和 ...
问题导读 1、怎样部署在程序中调用spark服务的环境? 2、在程序中IDE中远程调用服务,需要做哪些配置? 3、JavaSparkContext ...
问题导读 1.什么是Spark? 2.Spark生态系统包括哪些? 3.Spark的依赖有哪些? 4.了解Spark架构是怎样的? 5.Spark是如何运 ...
本帖最后由 nettman 于 2015-3-31 16:12 编辑 问题导读 1.如何加大IDEA的启动内存? 2.IDEA会生成大量的缓存文件,如何修改 ...
问题导读: 1、 Spark生态圈由哪些部分组成? 2、Spar和Hadoop MapRedeuce相比,有哪些优势? 3、Spark适用于哪些环境? ...
问题导读 1、如何持久化流数据到内存中? 2、什么是Checkpointing? 3、如何监控应用程序? 本文接前篇: Spark ...
问题导读 1.本文讲了spark的那些优势? 2.淘宝使用spark来解决什么问题? 3.优酷土豆为什么使用spark? M ...
本帖最后由 InSight 于 2015-4-26 18:24 编辑 问题导读: 1.什么是Spark? 2.Spark的核心组件有哪些? 3.Spark整体架构如 ...
问题导读 1.spark做了哪些改进? 2.本文认为spark与hadoop的关系是什么? Spark 1.2 发布,此版本包括 172 位贡 ...
问题导读 1.spark单独机器处理数据过大,会产生什么问题? 2.spark是否能支持复杂sql? 3.spark有未来哪些需要改进的地方 ...
问题导读 1、TDW Spark与MapReudce有哪些不同? 2、传统的MapReduce/Pig类框架存在着哪方面严重的性能问题? 3、你如何理解T ...
RDD(Resilient Distributed Datasets) ,弹性分布式数据集, 是分布式内存的一个抽象概念,RDD提供了一种高度受限的共享内存模型 ...
2014年的大数据领域,Apache Spark(以下简称Spark)无疑最受瞩目。Spark,出自名门伯克利AMPLab之手,目前由商业公司Databricks ...
问题导读: 1.Spark 2.1.0有哪些主要改动?2.Spark 2.1.0的性能和稳定性有哪些改进? Spark 2.1.0是2.x分支中的第 ...
问题导读 1.spark如何增加CPU利用率? 2.partition是什么? 3.并行的executor的数量,有哪两种方式? 下面这些关 ...
问题导读 1.UDF对spark sql的作用是什么? 2.用Scala编写的UDF与普通的Scala函数唯一的区别在什么地方? 3.如何在spark中 ...
怎么从web到spark集群 如wordcount,怎么从web应用调用并传参数(如传文件路径啥的)给wordcount? 并取得wordcount的结果 ...
问题导读 1.sqlContext有哪些关键的概念和组件? 2.LogicalPlan里维护着什么方面的数据? 3.LogicalPlan有哪三种类型? 4. ...
问题导读 1.RDD之间的依赖关系可以分为哪两类?2.spark rdd有哪两种容错方式?3.Spark中的RDD两种类型的操作,包括转换(Transf ...
问题导读 1.spark提供了哪三种方式配置系统?2.环境变量如何配置?3.spark.executor.memory的含义是什么? Spark提供 ...
问题导读 1.通过什么途径,可以查看与spark兼容的组件版本? 2.如何获取pom文件? 3.pom文件中包含了哪些信息? 4.spark编 ...
本帖最后由 醉半城 于 2017-9-11 20:32 编辑 问题导读: 1.SparkSubmit提交脚本是什么样? 2.SparkSubmit提交的参数内部怎么 ...
spark有哪些概念?
此篇文章的基础,需要对hadoop mapreduce有一定的了解,否则此文章可能看不懂。可以参考 Mapreduce shuffle和排序 MapRe ...
本帖最后由 xioaxu790 于 2015-2-6 22:17 编辑 问题导读 1、什么是Consumer Rebalance? 2、如何理解消息Deliver guarantee ...
本帖最后由 xioaxu790 于 2014-10-16 19:44 编辑 问题导读 1、你如何理解Spark的应用场景? 2、Spark的 "reduce"和MapReduce ...
本帖最后由 Oner 于 2017-1-19 14:56 编辑 问题导读:1. 进行数据挖掘前需要了解哪些Spark基础?2. 什么是朴素贝叶斯算法?3 ...
问题导读 1.本文是基于什么环境? 2.如何实现数据转发? 3.spark streaming 处理的代码是如何实现的? 曾经 ...
问题导读: 1、什么是广播变量和累加器? 2、Java和Scala如何实现? 一、广播变量和累加器 1.1 广播变量: 广播 ...
本版积分规则 发表帖子
查看 »