用户组:游客
问题导读 1.spark客户端有哪些配置列表? 2.如何向spark集群提交应用? 3.deploy-mode参数都是什么含义? 1. Sp ...
问题导读 1.在IDEA 环境下打包spark源码包含哪些步骤? 2.提交spark任务需要做哪些准备? 打开IDEA 在s ...
问题导读: 1.spark算子分区怎么理解? 2.怎么用代码去查找分区及分区中的数据? Spark RDD是被分区的,在生成 ...
问题导读: 1.Spark SQL接口是什么? 2.sbt的依赖有哪些? 3.Spark SQL + Hive + Hbase方式集成 操作是什么? ...
问题导读: 1.DStreamGraph怎么用? 2.DStream的依赖链是怎么样的? 在 Spark Streaming 中,DStreamGraph 是一个非 ...
问题导读: 1.streaming application 如何兼容众多数据源?2.receivers 是如何分发并启动的?3.receiver 接收到的数据是如何 ...
问题导读: 1.JobGenerator中的定时逻辑是什么?2.为 batch 生成 jobs的流程是什么?3.jobs的生成过程有哪几步? Job ...
问题导读: 1.什么是Spark Streaming?2.Spark Streaming如何工作?3.怎样实现Spark Streaming? 本篇文章用Spark Stre ...
问题导读: 1.什么是Spark Streaming?2.怎样用Spark Streaming做关键词检测?3.怎样实现关键词检测程序? 许多公司使 ...
问题导读 1.spark如何实现列统计汇总? 2.MLlib在本文有哪些作用? Spark Mllib 统计模块代码结构如下: 1.1 ...
问题导读 1.本文解决了什么问题,场景是什么? 2.Spark DataSource API 如何实现Rest数据源的? 3.数据扫描的方法,目前 ...
本帖最后由 Oner 于 2016-10-27 17:14 编辑 问题导读: 1. LDA主题模型算法简介 2. Spark实现LDA的GraphX基础 3. PySparkml ...
问题导读: 1.什么是zeppelin?2.怎样实现zeppelin多租户使用? 1、zeppelin简介zeppelin是基于Web的可视化交互 ...
问题导读: 1、spark streaming任务日志遇到的问题有哪些? 2、spark streaming如何集中收集log? 3、如何配置apache log4j实 ...
问题导读 1.本文如何实现读取Postgresql某一张表的数据为DataFrame? 2.如何写入Postgresql某张表中? 3.如何提交程序 ...
问题导读: 1、什么是输入分区与输出分区一对一型? 2、什么是输入分区与输出分区多对一型? 3、什么是输入分区与输出分区多 ...
问题导读: 1.世纪佳缘推荐算法中运用什么算法产生候选集?2.世纪佳缘推荐算法中排序算法怎样实现的? 世纪佳缘推荐场 ...
比如RDD里的计算调用了别的组件类里的方法(比如hbase里的put方法),那么序列化时,会将该方法所属的对象的所有变量都序列化的 ...
问题导读 1.Spark on YARN客户端模式作业运行过程是什么? 2.Spark on YARN集群模式作业运行过程是什么? 3.二者的区别是什 ...
问题导读: 1.什么是PySpark?2.怎样利用PySpark处理数据并进行图表分析?3.使用PySpark过程中需要注意哪些事项? ...
本帖最后由 PeersLee 于 2016-4-27 19:55 编辑 问题导读: 1.本文内容适用范围是什么? 2.DStream, transformation, outpu ...
问题导读 1.SparkSession的功能有哪些? 2.如何创建SparkSession? 3.SparkContext在Spark中的主要功能有哪些? ...
问题导读: 1.什么是Zeppelin?2.Zeppelin有哪几种分享方式? 本篇文章着重介绍如何将您制作好的notebook / report ...
本帖最后由 丫丫 于 2016-10-7 20:48 编辑 问题导读 1、shipyard是什么? 2、engine是什么? 3、rethinkdb是什么? 4、 ...
问题导读: 1、如何理解在应用程序间、程序内调度? 2、集群的资源分配有哪些方式? 3、资源分配策略有哪些? 4、如何配置调 ...
问题导读 1.本文的问题背景是什么? 2.本文中问题有哪三种解决办法? 3.三个思路有什么不同? 软件版本及平台 ...
有两种创建StreamingContext的方式: 第一种通过SparkConf [mw_shl_code=scala,true]val conf = new SparkConf().setAp ...
问题导读 1.spark如何开启黑名单机制? 2.哪些条件将executors列入黑名单? 3.整个节点被列入黑名单,executors如何处理? ...
问题导读:1. Spark 中的 Transform 和 Action 区别是什么?2. foreachPartition 属于Transform 和 Action中的哪种操作?3. mapP ...
问题导读 1.Spark MLFlow用来做什么的? 2.MLFlow解决了什么问题? 3.MLFlow哪些问题未解决? MLflow 是由Apache ...
本版积分规则 发表帖子
查看 »