用户组:游客
本帖最后由 xioaxu790 于 2014-7-18 19:16 编辑 问题导读 1、如何理解SQL Core? 2、RDD支持的第三方格式有哪些? 3、SQLCo ...
本帖最后由 pig2 于 2015-3-19 22:23 编辑 问题导读 1、RDD程序的调试工具是什么? 2、如何学习可迭代的机器应用? ...
问题导读 1、Spark更加有效率运行的原理是什么? 2、如何理解转换、动作? 分布式数据集支持两种操作: 转换(transf ...
问题导读 1、Spark支持哪些共享变量? 2、如何操作累加器? Spark的第二个抽象,是并行计算中使用的共享变量。一般来 ...
本帖最后由 pig2 于 2014-9-14 12:40 编辑 问题导读 1、yarn提交作业的流程是怎样的? 2、run方法在ApplicationMaster里面主 ...
本帖最后由 pig2 于 2014-10-4 23:42 编辑 问题导读 1.Standalone部署方式包含哪些组件?2.driver启动包含哪些过程?3.Worker ...
本帖最后由 pig2 于 2014-10-4 23:47 编辑 阅读导读: 1.TaskScheduler的工作原理是什么? 2.TaskScheduler与SchedulerBacke ...
问题导读 1、利用Spark将json文件导入Cassandra的前提条件有哪些? 2、本次实验需要结合哪些知识? 3、进行数据导入时,需要 ...
本帖最后由 xioaxu790 于 2014-10-21 17:46 编辑 问题导读 1、如何理解Spark的fold操作? 2、如何该action的功能? 3、什么 ...
问题导读 1、你如何理解Spark的基本架构和重要模块? 2、Spark分为哪几个主要的子模块? 3、Spark采用了什么设计方式和整体架 ...
本帖最后由 pig2 于 2015-3-9 02:42 编辑 问题导读 1.Spark-cassandra-connector的作用是什么? 2.CassandraRDDPartitioner ...
问题导读 1、spark实验环境搭建流程是什么? 2、spark中job的生成和运行流程具体步骤是? 3、Spark布置环境中组件构成分 ...
问题导读 1、什么是Optimizer? 2、优化的主要策略总结起来是哪几大类? 3、如何理解Optimizer的工作方式? 本文 ...
本帖最后由 xioaxu790 于 2014-12-15 13:55 编辑 问题导读 1、什么是Physical Plan? 2、如何理解Optimizer工作流程? 3、 ...
问题导读 1、如何理解 Spark Plan的4种操作类型? 2、joinRow的实现本质是什么? 3、什么是ShuffleHashJoin? 本 ...
问题导读 1、Spark SQL有哪些函数类型? 2、如何理解Spark目前的UDF原理? 3、如何编写一个spark udf? 在SQL的世 ...
本帖最后由 feilong 于 2018-1-12 19:13 编辑 问题导读 1.Covtype数据集在哪里下载? 2.使用Spark MLib实现一个决策树要做 ...
问题导读 1.AUC指标是什么? 2.决策树现实时数据集要分成几份? 3.DecisionTree有哪几个方法? 上一篇:Spark 高 ...
问题导读 1.什么是良好的决策规则? 2.基尼系数与什么有关?基尼不纯度方程是什么? 3.熵是什么?其方程是什么? ...
本帖最后由 feilong 于 2018-3-9 12:57 编辑 问题导读 1.网络攻击的模式有哪些? 2.K-Means如何检测网络异常? 3.本章所 ...
本帖最后由 feilong 于 2018-3-30 11:39 编辑 问题导读 1.如何使用Spark实现K-Means聚类k值的选择? 2.K值是不是越大越好 ...
问题导读 1.什么是分类变量? 2.什么是熵? 3.文中使用熵做何种操作? 上一篇:Spark 高级分析:第五章第8节 ...
本帖最后由 feilong 于 2018-5-12 12:17 编辑 问题导读 1.如何执行聚类? 2.如何解释分析结果? 3.Spark畜类K-Means聚类 ...
问题导读 1.什么是LSA?为什么需要LSA? 2.什么是SVD? 3.什么是词语文档矩阵? 4.什么是TF-IDF,有何作用,Spark中是否有 ...
问题导读 1.从哪里获取数据?得到数据后存储在哪里? 2.文章中如何将XML转换成纯文本? 3.XmlInputFormat是什么? ...
本帖最后由 feilong 于 2018-6-1 09:15 编辑 问题导读 1.什么是词干?如何进行词形还原?如何用代码实现? 2.如何利用Spar ...
问题导读 1.为什么产生TensorFlowOnSpark? 2.TensorFlowOnSpark解决了什么问题? 3.TensorFlowOnSpark是否支持TensorFlow ...
本帖最后由 feilong 于 2018-6-22 10:48 编辑 问题导读 1.什么是余弦相似度,如何计算? 2.LSA有哪些降维的方式? 3.LSA ...
本帖最后由 feilong 于 2018-6-29 11:16 编辑 问题导读 1.什么是文档相关性,如何计算? 2.什么是词文档相关性,如何计算 ...
问题导读 1.图论和网络科学是如何产生影响的? 2.GraphX是什么? 3.MEDLINE是什么,有什么用? 上一篇:Spark ...
本版积分规则 发表帖子
查看 »