用户组:游客
问题导读: 1.Spark在机器学习算法的实现上有哪些问题?2.Spark on Angel是如何解决Spark在机器学习任务中遇到的瓶颈?3.Spa ...
问题导读: 1.如何用Hadoop的FileSystem实现在已有目录下用一个文件保存Spark数据?2.如何分块读取RDD数据并保存到hdfs?3. ...
本帖最后由 levycui 于 2021-1-20 20:13 编辑 问题导读: 1、如何理解CBO基本原理? 2、如何阅读Spark CBO源码实现? 3、Sp ...
本帖最后由 pig2 于 2014-7-30 19:58 编辑 问题导读 1、什么是options参数? 2、使用什么命令来启动所有的cf组件? ...
问题导读 1、Spark的DAGScheduler是什么? 2、DAGScheduler的运行过程是怎样的? 3、如何理解Spark应用之间的调度? ...
问题导读: 1.启动spark的原理是什么? 2.启动spark-shell需要申请什么资源? 本篇是对Spark1.0.0 运行架 ...
问题导读: 1.RDD的本质是什么? 2.它的作用是什么? 3.RDD提供了哪方面的属性? 4.RDD的transformation与action分别是什么 ...
本帖最后由 Oner 于 2017-11-16 17:18 编辑 问题导读: 1. shuffle 相关的配置参数有哪些? 2. Storage相关的配置参数有哪些 ...
问题导读 1.spark SQL与传统数据库的区别在什么地方? 2.spark SQL独立使用,是否还需要hive? 3.Spark SQL都可以读取哪些 ...
Normalizer Normalizer是一个Transformer,它使用p-norm范数对数据集进行正则化,默认p的取值为2,借助Normalizer可以标准化输 ...
本帖最后由 坎蒂丝_Swan 于 2014-12-30 12:28 编辑 1、存储系统 如果可以的话,把Spark的hadoop的节点安装在一起, ...
问题导读 1.spark安装需要哪些环境? 2.如何配置spark? 3.如何启动spark? Spark1.2.0伪分布式安装 ...
本帖最后由 yuwenge 于 2015-5-9 22:14 编辑 问题导读 1.什么是关联规则挖掘? 2.关联规则有哪些术语? 3.什么是FP-Growt ...
问题导读 1.spark安装包如何下载? 2.如何git下载源码包? 3.如果通过maven下载spark? 1.安装包下载 ...
问题导读 1.spark Streaming支持哪些语言? 2.spark Streaming是否具有故障恢复功能? Spark Streaming使容易的 ...
问题导读 1.在Topology中我们可以指定spout、bolt的并行度,在提交Topology时Storm如何将spout、bolt自动发布到每个服务器并 ...
问题导读 1.spark job与RDD的关系是什么? 2.什么是Executor? 3.什么是Driver? 1.1 术语定义 [*]Applic ...
问题导读: 1.Smack 4.1的改进有哪些?2.Smack 4.1的API变化有哪些? 一、Smack 4.1的主要改进 Smack 4.1.x最 ...
问题导读 1.Spark 3.3 新增了哪些特性? 2.Join查询性能提升最高可提高多少倍? 3.自适应查询执行(AQE)做了哪些改进? ...
问题导读 1.大数据处理可以分为哪三个类型? 2.Spark有哪些基本概念? 3.MapReduce如何转换到 Spark? 作者: ...
问题导读 1.spark客户端有哪些配置列表? 2.如何向spark集群提交应用? 3.deploy-mode参数都是什么含义? 1. Sp ...
问题导读 1.在IDEA 环境下打包spark源码包含哪些步骤? 2.提交spark任务需要做哪些准备? 打开IDEA 在s ...
问题导读: 1.spark算子分区怎么理解? 2.怎么用代码去查找分区及分区中的数据? Spark RDD是被分区的,在生成 ...
问题导读: 1.streaming application 如何兼容众多数据源?2.receivers 是如何分发并启动的?3.receiver 接收到的数据是如何 ...
问题导读: 1.JobGenerator中的定时逻辑是什么?2.为 batch 生成 jobs的流程是什么?3.jobs的生成过程有哪几步? Job ...
问题导读: 1.什么是Spark Streaming?2.Spark Streaming如何工作?3.怎样实现Spark Streaming? 本篇文章用Spark Stre ...
问题导读: 1.什么是Spark Streaming?2.怎样用Spark Streaming做关键词检测?3.怎样实现关键词检测程序? 许多公司使 ...
问题导读 1.spark如何实现列统计汇总? 2.MLlib在本文有哪些作用? Spark Mllib 统计模块代码结构如下: 1.1 ...
问题导读 1.本文解决了什么问题,场景是什么? 2.Spark DataSource API 如何实现Rest数据源的? 3.数据扫描的方法,目前 ...
本帖最后由 Oner 于 2016-10-27 17:14 编辑 问题导读: 1. LDA主题模型算法简介 2. Spark实现LDA的GraphX基础 3. PySparkml ...
本版积分规则 发表帖子
查看 »