用户组:游客
阅读导读: 1.Spark的发展历史? 2.Spark的特色有哪些? 3.Tachyon与HDFS相比,怎样? 4.字数统计算法在java 8中如何实现? ...
问题导读 1.如何创建rdd? 2.什么是pair rdd? 3.如何获取数组指定列? 4.foreachRDD的作用是什么? 本文来自 ...
问题导读 1.Spark Streaming有哪些优势? 2.Discretized Stream在Spark中起到哪些作用? 概述Spark ...
问题导读 1. Spark出现问题如何定位? 2. Spark日志中,各种状态的意义? 3. Spark任务都有哪几个耗时阶段? 4. Spark任务如 ...
问题导读 1.cluster mode 模式运行包含哪些流程? 2.yarn mode 运行模式有什么特点? 3..在关闭http file server进程时, ...
本帖最后由 pig2 于 2015-2-11 18:58 编辑 Spark中文手册1-编程指南 http://www.aboutyun.com/thread-11413-1-1.html ...
问题导读: 1.如何基于Spark做机器学习? 2.如何基于Spark做新词发现? 3.如何基于Spark做智能问答? Hi,大家好! ...
spark: 科普Spark,Spark是什么,如何使用Spark(1) http://www.aboutyun.com/thread-6849-1-1.html 科普Spark,Spark核 ...
问题导读: 1.DStream流有哪些操作?2.什么是窗口函数?3.DStream流有哪些输出操作? 根据Spark官方文档中的描述 ...
问题导读1.spark中什么是stage?2.什么是 kafka topic?3.本文中kafka和消费者线程遵循哪些约束? 最近在做利用Spark s ...
问题导读: 1.Spark 2.1.0有哪些主要改动?2.Spark 2.1.0的性能和稳定性有哪些改进? Spark 2.1.0是2.x分支中的第 ...
问题导读 1.spark如何增加CPU利用率? 2.partition是什么? 3.并行的executor的数量,有哪两种方式? 下面这些关 ...
本帖最后由 Oner 于 2017-2-22 16:57 编辑 问题导读: 1. 什么是TensorFlow? 2. TensorFlow On Spark出现的意义在于什么? ...
本帖最后由 pig2 于 2017-12-6 19:18 编辑 问题导读: 1. 为什么会出现 Spark SQL 这个模块? 2. 什么是Spark SQL/DataFra ...
本帖最后由 InSight 于 2015-4-26 18:24 编辑 问题导读: 1.什么是Spark? 2.Spark的核心组件有哪些? 3.Spark整体架构如 ...
问题导读 1.spark单独机器处理数据过大,会产生什么问题? 2.spark是否能支持复杂sql? 3.spark有未来哪些需要改进的地方 ...
问题导读 1.spark做了哪些改进? 2.本文认为spark与hadoop的关系是什么? Spark 1.2 发布,此版本包括 172 位贡 ...
问题导读 1.本文讲了spark的那些优势? 2.淘宝使用spark来解决什么问题? 3.优酷土豆为什么使用spark? M ...
问题导读: 1、 Spark生态圈由哪些部分组成? 2、Spar和Hadoop MapRedeuce相比,有哪些优势? 3、Spark适用于哪些环境? ...
作为个人经验总结: 比如 RDD 缓存分布不均匀 是影响spark 的很大的性能之一,为什么这么说? spark调优是需要 ...
本帖最后由 levycui 于 2018-9-4 20:56 编辑 问题导读: 1、什么是 ETL? 2、如何理解离线 ETL 的架构设计及实现原理? 3、 ...
导读 spark是比较火的一门大数据技术,下面是某个同学的个人经验总结,借鉴过来,供大家参考 通过修改Spark的属性 ...
Apache Spark源码走读之1 -- Spark论文阅读笔记 Apache Spark源码走读之2 -- Job的提交与运行 Apache Spark源码走读 ...
本帖最后由 不会飞的小凯凯 于 2015-12-18 22:36 编辑 问题导读: 1.Spark内核有什么特性? 2.什么叫做RDD? 3.DAG和Stag ...
问题导读: 1.什么是TaskSchedulerBackend、SchedulerBackend?2.FIFO与FAIR两种调度模式有什么区别?3.Task数据本地性资源怎 ...
问题导读 1、当前集群的可用资源不能满足应用程序的需求,怎么解决? 2、内存里堆的东西太多了,有什么好办法吗? ...
问题导读: 1.spark是什么? 2.spark为什么节省磁盘io? 3.spark有哪两种容错方式? 4.什么是shark? 5.spark为什么擅长迭 ...
问题导读:1.Spark是什么?2.什么是Spark Streaming?3.Spark作为计算框架的优势是什么? 一. Spark基础知识 1.Spark ...
问题导读 1.为了提高容错,spark1.2加入了什么内容? 2.开启WAL,依旧会有数据丢失的原因是什么? 3.Kafka Direct API的运 ...
本版积分规则 发表帖子
查看 »