用户组:游客
问题导读: 1.如何搭建spark二次开发环境? 扩展: 2.spark开发环境与hbase、hadoop开发环境搭建有什么相同之处? 附上: h ...
本帖最后由 不会飞的小凯凯 于 2015-12-18 19:09 编辑 问题导读: 1.怎么样在winows环境下安装Spark? 2.怎么样安装IDE工 ...
问题导读: 1.Spark的安装需要准备哪些软件?2.单机怎样安装并配置Hadoop?3.单机怎样安装Spark? 本文将介绍Apache ...
在启动spark shell的时候,产生如下错误 [mw_shl_code=bash,true]Caused by: java.sql.SQLException: Failed to start datab ...
本帖最后由 levycui 于 2021-1-20 20:13 编辑 问题导读: 1、如何理解CBO基本原理? 2、如何阅读Spark CBO源码实现? 3、Sp ...
问题导读: 1.Spark在机器学习算法的实现上有哪些问题?2.Spark on Angel是如何解决Spark在机器学习任务中遇到的瓶颈?3.Spa ...
问题导读: 1、Spark Application的运行架构有哪些组成? 2、Spark on YARN 的运行过程是什么? 前言 Spark Applicati ...
问题导读: 1.如何Spark任务运行属性? 2.如何配置运行需要的环境变量及运行参数? 简介 Spark的配置系统 ...
本帖最后由 pig2 于 2017-6-15 09:11 编辑 问题导读 1.Spark Streaming提供了哪三种内置的数据源支持? 2.Receiver的作用 ...
问题导读: 1. 如何学习图数据处理和分析? 2. 如何用Apache Spark GraphX库进行图数据分析? 3. 哪些常用的图类算法? 4. ...
本帖最后由 hero1122 于 2017-7-31 19:07 编辑 问题导读: 1.什么是LDA文档问题模型? 2.LDA 建模算法是什么样的? 3.spa ...
本帖最后由 feilong 于 2017-9-1 17:58 编辑 问题导读 1.实验室中的分析和工厂的分析的区别是什么?2.数据在分析前需要做哪些 ...
问题导读: 1.SparkContext是什么? 2.SparkContext内部做了什么? SparkContext是什么 SparkContext是在Driver端创建 ...
本帖最后由 PeersLee 于 2017-9-27 18:13 编辑 问题导读: 1. 属性 Graph 是什么? 2. Graph 运算符有哪些? 3. Graph 建造 ...
本帖最后由 feilong 于 2017-10-13 11:57 编辑 问题导读 1.什么是Spark Shell,SparkContext,REPL? 2.什么是RDD? 3.如 ...
问题导读:1. Driver 端如何发送 LaunchTask 事件?2. CoarseGrainedSchedulerBackend 的作用是什么?3. Executor 端如何接收Lau ...
问题导读 1.哪些方法可以做数据的聚合? 2.集群上进行数据聚合时如何优化? 3.对存储在Map类型中的数据如何排序? 4.scala ...
问题导读: 1.什么是MLlib? 2.RDD和MR的区别? MLlib支持本地向量和单机存储的矩阵,或者以一个或多个RDD支持的分 ...
本帖最后由 xzc0202 于 2017-10-30 13:39 编辑 问题向导: (1)MLlib中的管道是什么? (2)管道组件有哪些? (3)管道具体工作 ...
问题导读 1.哪些场景使用以及如何使用map方法? 2.apply方法有何作用? 3.reduce方法有何作用? 上一篇:Sp ...
本帖最后由 xioaxu790 于 2014-9-12 18:17 编辑 问题导读 1、如何理解Spark应用程序的构造? 2、如何接入和初始化Spark? 3 ...
问题导读: 1.RDD的本质是什么? 2.它的作用是什么? 3.RDD提供了哪方面的属性? 4.RDD的transformation与action分别是什么 ...
问题导读 1.sparkSQL是如何发展而来的? 2.为什么sparkSQL的性能会得到怎么大的提升呢? 3.查询里采用通用的SQL语法去处 ...
本帖最后由 yuwenge 于 2015-6-2 20:59 编辑 问题导读 1.Spark on Yarn如何查看日志? 2.spark-env.sh文件的作用是什么? 3 ...
问题导读: 1.启动spark的原理是什么? 2.启动spark-shell需要申请什么资源? 本篇是对Spark1.0.0 运行架 ...
问题导读 1、Spark的DAGScheduler是什么? 2、DAGScheduler的运行过程是怎样的? 3、如何理解Spark应用之间的调度? ...
GraphX 是 图 和 图并行计算的 Apache Spark's API 灵活性 图与集合无缝结合 图结合ETL,探索性分析,迭代图计算。 ...
...
问题导读: 1.什么是Spark Streaming?2.怎样配置并运行Spark Streaming?3.怎样调优Spark Streaming? Spark Stream ...
本帖最后由 PeersLee 于 2016-4-13 19:01 编辑 问题导读: 1.Spark生态圈是否缺乏一个支持在线学习的流分析算法引擎? 2 ...
本版积分规则 发表帖子
查看 »