用户组:游客
本帖最后由 Oner 于 2016-12-8 13:43 编辑 问题导读: 1. 使用spark如何实现最大值最小值问题? 2. 使用spark如何实现平均 ...
问题导读: 1.DStream流有哪些操作?2.什么是窗口函数?3.DStream流有哪些输出操作? 根据Spark官方文档中的描述 ...
问题导读: 1.为什么IDEA连着把spark-1.4.1的源码都编译了? 2.怎样把hive-site.xml文件"送"给IEDA?3.怎样设置设置IEDA的JV ...
问题导读 1.本文认为spark oom分为哪两种情况? 2.Spark在一个Executor中的内存分为哪三块? 3.内存溢出解决方法本文提出 ...
问题导读:1.Spark是什么?2.什么是Spark Streaming?3.Spark作为计算框架的优势是什么? 一. Spark基础知识 1.Spark ...
问题导读 1.为了提高容错,spark1.2加入了什么内容? 2.开启WAL,依旧会有数据丢失的原因是什么? 3.Kafka Direct API的运 ...
问题导读 1.Spark 2.0SQL做了哪些改变? 2.Spark 2.0,DataFrame、Dataset API做了哪些改变? 3.Structured Streaming APIs是 ...
问题导读 1.cluster mode 模式运行包含哪些流程? 2.yarn mode 运行模式有什么特点? 3..在关闭http file server进程时, ...
问题导读 1、当前集群的可用资源不能满足应用程序的需求,怎么解决? 2、内存里堆的东西太多了,有什么好办法吗? ...
问题导读: 1.如何基于Spark做机器学习? 2.如何基于Spark做新词发现? 3.如何基于Spark做智能问答? Hi,大家好! ...
本帖最后由 不会飞的小凯凯 于 2016-4-8 17:15 编辑 问题导读: 1.Spark的引擎工具有哪些? 2.每个引擎工具各有什么作用? ...
问题导读 1.spark如何增加CPU利用率? 2.partition是什么? 3.并行的executor的数量,有哪两种方式? 下面这些关 ...
问题导读 1.为什么DataFrame比RDD在存储和计算上的效率更高? 2.Spark从API的角度看,可以分为哪两大类? 3.Spark支持的外部 ...
本帖最后由 不会飞的小凯凯 于 2015-12-18 22:36 编辑 问题导读: 1.Spark内核有什么特性? 2.什么叫做RDD? 3.DAG和Stag ...
Apache Spark源码走读之1 -- Spark论文阅读笔记 Apache Spark源码走读之2 -- Job的提交与运行 Apache Spark源码走读 ...
一、设置MAVEN_OPTS参数 在编译Spark的时候Maven需要很多内存,否则会出现类似下面的错误信息: [mw_shl_code=bash ...
问题导读: 1.spark是什么? 2.spark为什么节省磁盘io? 3.spark有哪两种容错方式? 4.什么是shark? 5.spark为什么擅长迭 ...
问题导读 1.Spark运行包含哪些流程? 2.本文认为Spark运行架构有哪些特点? 3.DAGScheduler的作用是什么? 4. RDD在Spark ...
问题导读 1.哪个配置项可实现Map Task的JVM参数? 2.容错有哪些参数? 3.本地运行需要配置哪些参数? 背景 ...
导读 spark是比较火的一门大数据技术,下面是某个同学的个人经验总结,借鉴过来,供大家参考 通过修改Spark的属性 ...
问题导读 1.spark有哪些基本概念? 2.spark运行原理是什么? 3.SparkContext的作用是什么? Spark是基于 ...
问题导读 1.什么是内存计算? 2.Apache Spark的设计思路是什么? 3.SAP HANA的设计思路是什么? 最近业界有很多 ...
问题导读 1.本文总结内存计算哪三个特点? 2.Apache Spark设计的思路是什么? 3.在Spark的支持算子方面有哪两大类? 4.能 ...
本帖最后由 InSight 于 2015-4-26 18:24 编辑 问题导读: 1.什么是Spark? 2.Spark的核心组件有哪些? 3.Spark整体架构如 ...
问题导读 1.Spark Streaming有哪些优势? 2.Discretized Stream在Spark中起到哪些作用? 概述Spark ...
问题导读: 1、了解Spark常见性能优化都有那些? 2、如何对Spark性能问题进行解决以及解决的方案都有那些? 问题1 ...
阅读导读: 1.Spark的发展历史? 2.Spark的特色有哪些? 3.Tachyon与HDFS相比,怎样? 4.字数统计算法在java 8中如何实现? ...
问题导读 1.spark单独机器处理数据过大,会产生什么问题? 2.spark是否能支持复杂sql? 3.spark有未来哪些需要改进的地方 ...
本帖最后由 pig2 于 2015-2-11 18:58 编辑 Spark中文手册1-编程指南 http://www.aboutyun.com/thread-11413-1-1.html ...
本版积分规则 发表帖子
查看 »