用户组:游客
本帖最后由 feilong 于 2018-8-31 14:13 编辑 问题导读 1.什么是小世界网路?其数学模型有何特性? 2.如何判定图示完全的 ...
问题导读 1、你如何理解转换(Transformations)的含义? 2、Spark实现机器学习算法的流程有哪些? 3、如何利用已有的训练样本 ...
问题导读 1.什么是PySpark? 2.PySpark经常用来做什么? 3.PySpark内部原理是什么? Spark 高级分析:第十章第5节 示例 ...
问题导读 1.JodaTime和NScalaTime分别是什么?如何使用? 2.Esri Geometry API作用是什么?如何获取?如何使用? 3.样例数 ...
本帖最后由 52Pig 于 2014-10-11 22:47 编辑 阅读导读: 1.SparkContext创建TaskScheduler和DAG Scheduler? 2.TaskSchedule ...
问题导读 1.什么是VaR?有哪些计算方法? 2.什么是蒙特卡洛模拟? 3.本章都有哪些金融相关术语? 关注最新经典文章,欢 ...
问题导读 1.spark-defaults.conf修改后,会造成哪些影响? 2.spark-env.sh中SPARK_MASTER_IP该如何指定? 3.spark-submit可 ...
本帖最后由 pig2 于 2014-9-14 12:43 编辑 问题导读 1、如何保存接收到的数据? 2、如何处理接收到的数据? 3、调用getOrCo ...
问题导读 1、如何理解spark的环境变量传递? 2、Task的派发源起于什么? 上一篇中介绍了Spark的各种运行模式的基本 ...
问题导读 1.什么是顶点的度?为什么需要引入这个概念? 2.Graphx中内置的计算度的方法是什么?如何使用? 3.如何过滤噪声边 ...
问题导读 1.Thunder核心数据类型有哪些? 2.如何用Thunder对神经元类型进行分类? 3.Thunder有哪些功能? Spark 高级 ...
问题导读 1.预处理的数据数据格式是怎样的? 2.哪些数据需要预处理?做怎样的处理? 3.预处理代码如何编写的? 关注最 ...
本帖最后由 Oner 于 2017-11-23 15:01 编辑 问题导读: 1. streaming kafka direct API 是如何实现的? 2. streaming kafka ...
问题导读 1.数据科学家的工作流程是怎样的? 2.Spark文件格式有哪些,如何使用? 3.Spark有哪些子项目,分别是做什么用的? ...
本帖最后由 pig2 于 2015-3-9 02:43 编辑 问题导读 1.在Standalone部署模式下,Spark运行过程中会创建哪些临时性目录及文 ...
本帖最后由 PeersLee 于 2017-9-27 18:13 编辑 问题导读: 1. 属性 Graph 是什么? 2. Graph 运算符有哪些? 3. Graph 建造 ...
问题导读: 1.SparkContext是什么? 2.SparkContext内部做了什么? SparkContext是什么 SparkContext是在Driver端创建 ...
本帖最后由 feilong 于 2017-9-1 17:58 编辑 问题导读 1.实验室中的分析和工厂的分析的区别是什么?2.数据在分析前需要做哪些 ...
本帖最后由 hero1122 于 2017-7-31 19:07 编辑 问题导读: 1.什么是LDA文档问题模型? 2.LDA 建模算法是什么样的? 3.spa ...
问题导读: 1. 如何学习图数据处理和分析? 2. 如何用Apache Spark GraphX库进行图数据分析? 3. 哪些常用的图类算法? 4. ...
问题导读: 1. Spark MLlib 在应用架构中是什么位置? 2. Spark MLlib 中算法怎么分类的? 3. 监督和非监督式学习的异同点? ...
本帖最后由 pig2 于 2017-6-15 09:11 编辑 问题导读 1.Spark Streaming提供了哪三种内置的数据源支持? 2.Receiver的作用 ...
本帖最后由 levycui 于 2019-6-19 20:43 编辑 问题导读: 1、SparkContext 如何创建过程? 2、如何理解Task 执行和回馈? 3 ...
问题导读 1.如何求样例数据中的文件总数? 2.图过滤的规则是什么? 3.如何分析过滤后的数据? 关注最新经典文章,欢迎 ...
问题导读 1.从哪里获取样例数据? 2.数据的数据结构是怎样的? 3.我们将如何对这些数据进行分析?使用什么工具? 关注 ...
问题导读 1.如何使用Spark实现K-Means聚类? 2.K-Means聚类对输入有何要求? 3.如何查看聚类结果? 上一篇:Spa ...
问题导读1.Spark与Hadoop MapReduce相比较有何优劣?2.如何使用Spark SQL分析数据? 去年网上曾放出个2000W的 ...
本帖最后由 xioaxu790 于 2014-12-15 13:19 编辑 问题导读 1、Analyzer在Spark SQL里起到了什么作用? 2、如何理解流程是实 ...
问题导读 1.如何安装Thunder? 2.示例中如何利用Thunder加载数据? 3.什么是像素? 4.如何将结果可视化? Spark 高级 ...
本帖最后由 pig2 于 2014-9-14 12:40 编辑 问题导读 1、yarn提交作业的流程是怎样的? 2、run方法在ApplicationMaster里面主 ...
本版积分规则 发表帖子
查看 »