用户组:游客
问题导读 1.为什么产生TensorFlowOnSpark? 2.TensorFlowOnSpark解决了什么问题? 3.TensorFlowOnSpark是否支持TensorFlow ...
问题导读 1.TensorflowOnSpark安装有哪些前提? 2.本文安装遇到了哪些坑? 3.后期遇到了哪些问题,又是如何解决的? ...
本帖最后由 feilong 于 2018-6-15 09:30 编辑 问题导读 1.什么是奇异值分解? 2.SVD是什么? 3.如何利用MLib得到奇异分解 ...
本帖最后由 feilong 于 2018-6-1 09:15 编辑 问题导读 1.什么是词干?如何进行词形还原?如何用代码实现? 2.如何利用Spar ...
问题导读 1.从哪里获取数据?得到数据后存储在哪里? 2.文章中如何将XML转换成纯文本? 3.XmlInputFormat是什么? ...
异常总结 ###1.Spark和hadoop依赖冲突 最近在实践项目遇到了问题,hadoop使用的是2.6.0(2.2.0也测试过),spark使用的1.2.1编译 ...
问题导读 1.什么是LSA?为什么需要LSA? 2.什么是SVD? 3.什么是词语文档矩阵? 4.什么是TF-IDF,有何作用,Spark中是否有 ...
本帖最后由 feilong 于 2018-5-12 12:17 编辑 问题导读 1.如何执行聚类? 2.如何解释分析结果? 3.Spark畜类K-Means聚类 ...
问题导读 1.什么是分类变量? 2.什么是熵? 3.文中使用熵做何种操作? 上一篇:Spark 高级分析:第五章第8节 ...
本帖最后由 feilong 于 2018-4-20 09:05 编辑 问题导读 1.标准分数方程是什么? 2.如何将特征归一化? 3.如何查看分析可 ...
Normalizer Normalizer是一个Transformer,它使用p-norm范数对数据集进行正则化,默认p的取值为2,借助Normalizer可以标准化输 ...
本帖最后由 desehawk 于 2018-4-16 21:39 编辑 问题导读 1.enable.auto.commit属性的作用是什么? 2.Offsests可以存储在哪 ...
本帖最后由 feilong 于 2018-4-6 21:39 编辑 问题导读 1.Spark本身有可视化工具吗? 2.如何用R将聚类结果可视化? 3.如何 ...
问题导读: 1.kafka 0.10有哪些更新?2.怎样实现Executor端缓存消费者?3.kafka 0.10在提高可靠性方面做了哪些改进? ...
本帖最后由 feilong 于 2018-3-30 11:39 编辑 问题导读 1.如何使用Spark实现K-Means聚类k值的选择? 2.K值是不是越大越好 ...
问题导读 1.如何使用Spark实现K-Means聚类? 2.K-Means聚类对输入有何要求? 3.如何查看聚类结果? 上一篇:Spa ...
群4中90371779,群友遇到这么个问题: [mw_shl_code=bash,true]application rejeted by queue placement policy[/mw_shl_ ...
此总结来自about云7群552029443 #### 看到群友,在使用spark2的时候,仍然使用的是spark1.x的函数。导致错误找不到类或 ...
本帖最后由 feilong 于 2018-3-9 12:57 编辑 问题导读 1.网络攻击的模式有哪些? 2.K-Means如何检测网络异常? 3.本章所 ...
内容整理自7群 CAM和Phineas 对于下面代码,运行产生问题 exception in thread"main" org.apache.spark.SparkEx ...
问题导读 1.什么是Kubernetes? 2.在Kubernetes集群尝试新功能,该如何实现? 3.观看群集上创建的Spark资源,该如何操作? ...
本帖最后由 feilong 于 2018-3-2 15:05 编辑 问题导读 1.什么是异常检测?有什么作用? 2.什么是聚类? 3.什么是K-Means ...
问题导读 1.什么是随机决策决策森林? 2.如何做预测? 3.Spark实现了哪几种分类算法? 上一篇:Spark 高级分析: ...
问题导读 1.如何调优决策树? 2.怎样修正分类特征? 3.参数最大深度对决策树结果有何影响? 上一篇:Spark 高级分 ...
问题导读 1.什么是良好的决策规则? 2.基尼系数与什么有关?基尼不纯度方程是什么? 3.熵是什么?其方程是什么? ...
问题导读 1.AUC指标是什么? 2.决策树现实时数据集要分成几份? 3.DecisionTree有哪几个方法? 上一篇:Spark 高 ...
本帖最后由 desehawk 于 2018-1-16 10:18 编辑 问题导读 1.Spark SQL在大规模数据集上遇到的哪些问题? 2.自适应执行的背 ...
本帖最后由 feilong 于 2018-1-12 19:13 编辑 问题导读 1.Covtype数据集在哪里下载? 2.使用Spark MLib实现一个决策树要做 ...
本帖最后由 feilong 于 2018-1-5 08:57 编辑 问题导读 1.决策树可以处理何种类型的问题? 2.什么是决策树?什么是随机决策 ...
问题导读:1. Spark 中的 Transform 和 Action 区别是什么?2. foreachPartition 属于Transform 和 Action中的哪种操作?3. mapP ...
本版积分规则 发表帖子
查看 »