用户组:游客
本帖最后由 desehawk 于 2015-6-8 18:59 编辑 问题导读 1.spark1.3.1默认不支持Hive,该如何解决? 2.如何编译spark? 3.Hi ...
问题导读: 1、如何学习Spark? 2、怎样来有效的阅读源代码? 大数据开源Spark 摘要: 大型开源项目源码走读并不是 ...
问题导读 1.spark1.6做了哪些改变? 2.性能提升做了哪些改进? 3.增加了哪些新的算法和功能? Apache Spa ...
问题导读: 1.Saprk怎么Running在Thrift JDBC Server上? 2.java JDBC怎么操作? Running the Thrift JDBC/ODBC server ...
问题导读 1.本文的场景是什么? 2.SparkSQL结合SparkStreaming,通过SQL实现实时计算数据统计需要做哪些准备? 3.SparkSQL ...
本帖最后由 eying 于 2015-10-21 16:10 编辑 问题导读: 1.Spark 1.5.0运程调试的过程? 2.安装调试前需要的事情 ...
本帖最后由 Oner 于 2016-7-1 01:28 编辑 问题导读: 1. Spark开发调优常见的有哪几个原则?如何使用? 2. Spark作业运行的 ...
本帖最后由 desehawk 于 2016-11-18 12:12 编辑 问题导读 1.本文的环境包含哪些软件? 2.如何安装开发环境? 3.提交源码 ...
本帖最后由 hyj 于 2015-4-16 00:27 编辑 问题导读 1.Spark将支持在哪些移动设备上运行? 2.目前Android Runtime (ART) 目前 ...
问题导读1.spark中什么是stage?2.什么是 kafka topic?3.本文中kafka和消费者线程遵循哪些约束? 最近在做利用Spark s ...
问题导读 1.在我们调用spark API时,背后发生了什么呢? 2.RDD.id是在初始化时生成的,id代表什么? 3.rdd.collect()调 ...
新建一个Java工程,将hadoop相关的jar包,hbase相关的jar包和spark-assembly-1.0.2-hadoop2.2.0.jar都导入工程中,然后直接复制 ...
本帖最后由 nettman 于 2015-4-3 20:28 编辑 问题导读 1.spark中什么是Application? 2.spark中什么是Driver Program? 3 ...
问题导读: 1.如何初始化sparkContext? 2.如何设置查询条件? 3.如何获得hbase查询结果Result? 由于spark提供 ...
本帖最后由 hero1122 于 2017-6-12 19:02 编辑 问题导读: 1.spark如何进行堆内内存规划? 2.spark如何进行堆外内存规划? ...
本帖最后由 pig2 于 2016-11-24 20:51 编辑 问题导读 1.如何设置断点调试Scala? 2.如何注释Scala? 3.如何格式化代码? ...
本帖最后由 rsgg03 于 2015-3-25 17:25 编辑 问题导读 1.腾讯如何使用Spark 技术的?带来了哪些好处? 2.Spark 技术最适用 ...
问题导读:1.Intellij IDEA是什么工具2.下载后,如何安装scala3.搭建Spark源码阅读环境需要什么操作?4.如何搭建sprk开发环境? ...
本帖最后由 nettman 于 2015-4-3 20:34 编辑 问题导读 1.Spark将中间结果保存在内存还是硬盘? 2.Spark什么情况下写入磁盘 ...
问题导读 1. Spark On Yarn 下executor-memory 参数如何生效? 2. Cluster 和 Client 模式中 内存开销的区别? 3. 规整化因子 ...
问题导读: 1.DStream流有哪些操作?2.什么是窗口函数?3.DStream流有哪些输出操作? 根据Spark官方文档中的描述 ...
问题导读 1.什么是Spark Package? 2.本文spark Package各自的作用是什么? 假如这个库能持续的发展下去,从 ...
本帖最后由 pig2 于 2015-4-1 21:32 编辑 问题导读 1.如何把JSON文件转化为DataFrame? 2.如何将MySQL表转化为DataFrame ...
问题导读: 1.如何使用 Spark Streaming 流计算?2.如何监控 Kafka 和 Spark Streaming?3.Spark Streaming 有什么不足 ...
问题导读: 1.什么时候需要启用 checkpoint?2.如何使用 checkpoint?3.在什么时机进行 checkpoint? 一个 Streaming ...
问题导读: 1.lambda架构原理是什么? 2.Hulu怎么进行数据收集? 3.怎么样监控数据? 在流式计算领域,Spark Streaming和 ...
本帖最后由 desehawk 于 2014-12-17 19:06 编辑 问题导读 1.LDA的有哪两个实际使用场景?2.对节点集合进行排序本文说了哪两种 ...
问题导读 1.Spark是什么? 2.如何理解Spark? 3.Spark扩展了MapReduce的哪些方面? 4.Spark可与Hadoop生态系统哪些组件集成 ...
本帖最后由 yuwenge 于 2015-5-7 21:03 编辑 问题导读 1.分布式图计算框架的目的是什么? 2.图存储模式本文分为了哪两种? ...
本版积分规则 发表帖子
查看 »