用户组:游客
本帖最后由 pig2 于 2014-5-11 14:38 编辑 问题导读:1、什么是Spark?2、 Spark和Hadoop的不同和整合? 前言:大数据 ...
问题导读: 1.怎样对DataFrame里面的数据进行采样?2.怎样查询DataFrame里面的数据?3.怎样将DataFrame保存成文件? 操作D ...
本帖最后由 wuyufei 于 2015-12-7 16:54 编辑 问题导读: 1.输入数据与预期结构是什么? 2.如何进行二进制和多标签分类? 3 ...
...
问题导读 本文比较短,但是思路清晰 1.Scala开发使用eclipse如何开发? 2.如何安装Scala的Eclipse插件? 3.如何验证安装 ...
本帖最后由 nettman 于 2015-4-3 20:34 编辑 问题导读 1.Spark将中间结果保存在内存还是硬盘? 2.Spark什么情况下写入磁盘 ...
问题导读: 1.Smack 4.1的改进有哪些?2.Smack 4.1的API变化有哪些? 一、Smack 4.1的主要改进 Smack 4.1.x最 ...
问题导读 1.spark job与RDD的关系是什么? 2.什么是Executor? 3.什么是Driver? 1.1 术语定义 [*]Applic ...
问题导读 1.在Topology中我们可以指定spout、bolt的并行度,在提交Topology时Storm如何将spout、bolt自动发布到每个服务器并 ...
GraphX 是 图 和 图并行计算的 Apache Spark's API 灵活性 图与集合无缝结合 图结合ETL,探索性分析,迭代图计算。 ...
易于使用 使用Java, Scala 和 Python. MLlib 适合 Spark's APIs 于使用Python NumPy 交互((开始于Spark 0.9).) ...
问题导读 1.在spark程序中,如何使用spark sql? 2.spark对于不同的数据源是如何处理的? 3.spark sql是否支持 JDBC 和 ...
问题导读 1.spark Streaming支持哪些语言? 2.spark Streaming是否具有故障恢复功能? Spark Streaming使容易的 ...
问题导读 1.spark安装包如何下载? 2.如何git下载源码包? 3.如果通过maven下载spark? 1.安装包下载 ...
本帖最后由 yuwenge 于 2015-6-2 20:59 编辑 问题导读 1.Spark on Yarn如何查看日志? 2.spark-env.sh文件的作用是什么? 3 ...
问题导读 1.hive/console能做什么? 2.hive/console原理是什么? 3.hive/console有哪些常用操作? 4.如何查看运行计划 ...
本帖最后由 yuwenge 于 2015-5-9 22:14 编辑 问题导读 1.什么是关联规则挖掘? 2.关联规则有哪些术语? 3.什么是FP-Growt ...
问题导读 1.sparkSQL中核心的组件是什么? 2.SchemaRDD组成都包含什么? 3.sparkSQL是否支持多种数据源? 4.spark SQL支持 ...
本帖最后由 nettman 于 2015-4-3 20:28 编辑 问题导读 1.spark中什么是Application? 2.spark中什么是Driver Program? 3 ...
问题导读 1.什么是spark RDD? 2.本文讲了RDD哪些特点? 3.有哪两种方式可以创建RDD? 4.RDD Transform基本方法有哪些? 5 ...
问题导读 1.sparkSQL是如何发展而来的? 2.为什么sparkSQL的性能会得到怎么大的提升呢? 3.查询里采用通用的SQL语法去处 ...
本帖最后由 pig2 于 2014-4-2 01:14 编辑 1.Spark的核心思路是什么? 2.Spark的适用场景是什么?
问题导读 1.spark安装需要哪些环境? 2.如何配置spark? 3.如何启动spark? Spark1.2.0伪分布式安装 ...
问题导读 1、Spark如何快速上手? 2、如何运行你的Spark 应用程序? 3、学习Spark,你有怎样的见解? 快速上手 ...
本帖最后由 nettman 于 2015-1-21 10:30 编辑 问题导读 1、如何看待Spark生态系统? 2、为什么比MapReduce快呢? 3、如何走 ...
问题导读 1、Hadoop有哪些诸多局限性? 2、相比MapReduce,Spark在这些需求中有哪些优势? 3、如何看待spark? 20 ...
本帖最后由 坎蒂丝_Swan 于 2014-12-30 12:28 编辑 1、存储系统 如果可以的话,把Spark的hadoop的节点安装在一起, ...
本帖最后由 坎蒂丝_Swan 于 2014-12-29 16:07 编辑 问题导读 1.创建Dstream的时候有什么要注意的地方? 2.对于调优 ...
问题导读: 1.Spark如何部署到yarn? 2.Spark如何基于Scala进行开发? 下载 虽然Spark已经提供了针对Hadoop1 ...
本帖最后由 pig2 于 2014-12-21 22:07 编辑 问题导读 1.spark独立部署如何访问hadoop集群数据? 2.spark有哪些启动脚本? ...
本版积分规则 发表帖子
查看 »