用户组:游客
问题导读 1.如何确定权重因子? 2.如何拟合线性模型? 3.如何进行数据抽样? 关注最新经典文章,欢迎关注公众号 ...
问题导读 1.预处理的数据数据格式是怎样的? 2.哪些数据需要预处理?做怎样的处理? 3.预处理代码如何编写的? 关注最 ...
问题导读 1.什么是蒙特卡洛风险模型? 2.模型公式是什么? 3.文中从哪里获取股票数据? 关注最新经典文章,欢迎关注公 ...
问题导读 1.什么是Spark会话化?如何使用? 2.groupByKeyAndSortValues作用是什么,如何使用? 3.出租车地理数据分析的意义 ...
问题导读 1.出租车数据中哪些数据可以去除? 2.处理出租车数据时如何使用前几章提到的API? 3.如何分析出租车地理数据? ...
问题导读 1.GeoJson是什么?如何使用? 2.Spray是什么?如何使用? 3.常用的Scala Collections API方法有哪些? 关注 ...
问题导读 1.JodaTime和NScalaTime分别是什么?如何使用? 2.Esri Geometry API作用是什么?如何获取?如何使用? 3.样例数 ...
问题导读 1.从哪里获取样例数据? 2.数据的数据结构是怎样的? 3.我们将如何对这些数据进行分析?使用什么工具? 关注 ...
问题导读 1.计算图中顶点之间的路径长度是什么样的过程? 2.什么是BSP?什么是Pregel? 3.GraphX中如何计算顶点之间路径长 ...
本帖最后由 feilong 于 2018-8-31 14:13 编辑 问题导读 1.什么是小世界网路?其数学模型有何特性? 2.如何判定图示完全的 ...
问题导读 1.如何求样例数据中的文件总数? 2.图过滤的规则是什么? 3.如何分析过滤后的数据? 关注最新经典文章,欢迎 ...
问题导读 1.什么是顶点的度?为什么需要引入这个概念? 2.Graphx中内置的计算度的方法是什么?如何使用? 3.如何过滤噪声边 ...
问题导读 1.什么是连通图?如何判断? 2.Graphx中内置的计算连通分支的方法是什么?如何使用? 3.判断图是否是连通图对数据 ...
本帖最后由 feilong 于 2018-8-3 09:50 编辑 问题导读 1.怎样做有助于我们了解网络整体结构? 2.Graphx是什么? 3.创建图 ...
问题导读 1.如何获取样本数据的总体分布? 2.哪些主题词出现的频率最高?有什么规律? 3.Scala库中方法combinations有何作 ...
问题导读 1.如何获取样本数据? 2.如何使用Scala解析XML文件? 3.Scala解析XML文件需要导入依赖吗? 上一篇:Sp ...
问题导读 1.图论和网络科学是如何产生影响的? 2.GraphX是什么? 3.MEDLINE是什么,有什么用? 上一篇:Spark ...
本帖最后由 feilong 于 2018-7-6 12:24 编辑 问题导读 1.如何进行多词查询? 2.怎样使用Spark实现多词查询? 3.奇异值分 ...
本帖最后由 feilong 于 2018-6-29 11:16 编辑 问题导读 1.什么是文档相关性,如何计算? 2.什么是词文档相关性,如何计算 ...
本帖最后由 feilong 于 2018-6-22 10:48 编辑 问题导读 1.什么是余弦相似度,如何计算? 2.LSA有哪些降维的方式? 3.LSA ...
本帖最后由 feilong 于 2018-6-15 09:38 编辑 问题导读 1.如何校验SVD的输出? 2.SVD中V代表什么? 3.如何得到文档集? ...
问题导读 1.TensorFlowOnSpark的架构与设计包括哪两个基本内容? 2.将TensorFlow集群部署在Spark主要解决什么问题? 3.TensorF ...
问题导读 1.为什么产生TensorFlowOnSpark? 2.TensorFlowOnSpark解决了什么问题? 3.TensorFlowOnSpark是否支持TensorFlow ...
问题导读 1.TensorflowOnSpark安装有哪些前提? 2.本文安装遇到了哪些坑? 3.后期遇到了哪些问题,又是如何解决的? ...
本帖最后由 feilong 于 2018-6-15 09:30 编辑 问题导读 1.什么是奇异值分解? 2.SVD是什么? 3.如何利用MLib得到奇异分解 ...
本帖最后由 feilong 于 2018-6-1 09:15 编辑 问题导读 1.什么是词干?如何进行词形还原?如何用代码实现? 2.如何利用Spar ...
问题导读 1.从哪里获取数据?得到数据后存储在哪里? 2.文章中如何将XML转换成纯文本? 3.XmlInputFormat是什么? ...
问题导读 1.什么是LSA?为什么需要LSA? 2.什么是SVD? 3.什么是词语文档矩阵? 4.什么是TF-IDF,有何作用,Spark中是否有 ...
本帖最后由 feilong 于 2018-5-12 12:17 编辑 问题导读 1.如何执行聚类? 2.如何解释分析结果? 3.Spark畜类K-Means聚类 ...
问题导读 1.DataFrame中本文使用了row哪些方法? 2.操作DataFrame row需要导入什么包? 3.teenagersDF.map(teenager => "Name ...
本版积分规则 发表帖子
查看 »