用户组:游客
问题导读 1.如何评估推荐质量? 2.评估模型时是否会将数据集作为一个整体作为输入? 3.什么是AUC?如何计算? ...
问题导读 1.DataFrame合并schema由哪个配置项控制? 2.修改配置项的方式有哪两种? 3.spark读取hive parquet格式的表,是否 ...
问题导读 1.DataFrame中本文使用了row哪些方法? 2.操作DataFrame row需要导入什么包? 3.teenagersDF.map(teenager => "Name ...
本帖最后由 pig2 于 2017-12-15 18:12 编辑 问题导读 1.RDD转换为DataFrame需要导入哪个包? 2.Json格式的Dataset如何转换 ...
本帖最后由 pig2 于 2017-12-15 18:11 编辑 问题导读 1.DataFrame如何创建tempview?2.sql()函数的作用是什么? s ...
问题导读 1.如何构建一个模型? 2.怎样进行抽样检测? 3.广播变量是什么?如何使用? 上一篇:Spark 高级分析: ...
本帖最后由 feilong 于 2017-12-1 12:38 编辑 问题导读 1.Spark MLib ALS限制条件是什么? 2.flatmap适用于什么场景? 3. ...
问题导读 1.spark SparkSession包含哪些函数? 2.创建DataFrame有哪些函数? 3.创建DataSet有哪些函数? 上一篇spa ...
本帖最后由 pig2 于 2017-11-28 16:22 编辑 问题导读 1.你认为为何出现SparkSession? 2.SparkSession如何创建RDD? 3.Sp ...
本帖最后由 Oner 于 2017-11-23 15:01 编辑 问题导读: 1. streaming kafka direct API 是如何实现的? 2. streaming kafka ...
问题导读 1.推荐引擎是什么? 2.推荐引擎一般用来做什么?有什么样的实例? 3.什么样的数据是隐式反馈数据? ...
问题导读 1.样例中是如何选择特征值作为分析依据的? 2.Spark Mlib是什么? 3.文章中建议学习Scala可以选择哪两本书? ...
问题导读 1.编译失败的可能问题有哪些? 2.指定hadoop版本,需要添加什么配置? 3.如不添加profile,会出现什么问题? ...
问题导读 1.spark集群能否单独运行? 2.如何在spark中指定想编译的hadoop版本? 3.构建的时候,版本选择需要注意什么? ...
问题导读 1.哪些场景使用以及如何使用map方法? 2.apply方法有何作用? 3.reduce方法有何作用? 上一篇:Sp ...
本帖最后由 xzc0202 于 2017-10-30 13:39 编辑 问题向导: (1)MLlib中的管道是什么? (2)管道组件有哪些? (3)管道具体工作 ...
问题导读 1.哪些方法可以做数据的聚合? 2.集群上进行数据聚合时如何优化? 3.对存储在Map类型中的数据如何排序? 4.scala ...
问题导读:1. Driver 端如何发送 LaunchTask 事件?2. CoarseGrainedSchedulerBackend 的作用是什么?3. Executor 端如何接收Lau ...
问题导读: 1.什么是MLlib? 2.RDD和MR的区别? MLlib支持本地向量和单机存储的矩阵,或者以一个或多个RDD支持的分 ...
本帖最后由 feilong 于 2017-10-13 11:57 编辑 问题导读 1.什么是Spark Shell,SparkContext,REPL? 2.什么是RDD? 3.如 ...
本帖最后由 PeersLee 于 2017-9-27 18:13 编辑 问题导读: 1. 属性 Graph 是什么? 2. Graph 运算符有哪些? 3. Graph 建造 ...
问题导读: 1.SparkContext是什么? 2.SparkContext内部做了什么? SparkContext是什么 SparkContext是在Driver端创建 ...
本帖最后由 feilong 于 2017-9-1 17:58 编辑 问题导读 1.实验室中的分析和工厂的分析的区别是什么?2.数据在分析前需要做哪些 ...
本帖最后由 hero1122 于 2017-7-31 19:07 编辑 问题导读: 1.什么是LDA文档问题模型? 2.LDA 建模算法是什么样的? 3.spa ...
本帖最后由 hero1122 于 2017-7-17 16:32 编辑 1.概述 首先,笔者要先申明,我也是初学机器学习领域的内容,虽然我是从事 ...
问题导读: 1. 如何学习图数据处理和分析? 2. 如何用Apache Spark GraphX库进行图数据分析? 3. 哪些常用的图类算法? 4. ...
本帖最后由 Tank_2000 于 2017-5-4 21:16 编辑 问题导读: 1.spark-submit 命令都有哪些参数可以设置? 2.如何合理设置spa ...
问题导读: 1.Spark的适用场景是什么?2.spark 运行流程是怎样的?3.Spark Streaming的运行原理是怎样的? spa ...
问题导读: 1.RDD的本质是什么?2.Shuffle的本质是什么?3.为什么Shuffle 容易导致Spark挂掉? 前言很多初 ...
问题导读: 1. Spark MLlib 在应用架构中是什么位置? 2. Spark MLlib 中算法怎么分类的? 3. 监督和非监督式学习的异同点? ...
本版积分规则 发表帖子
查看 »