用户组:游客
本帖最后由 levycui 于 2019-6-19 19:54 编辑 问题导读: 1、如何理解RPC 网络通信抽象? 2、如何理解Spark 通信架构? 3、 ...
问题导读 1.GeoJson是什么?如何使用? 2.Spray是什么?如何使用? 3.常用的Scala Collections API方法有哪些? 关注 ...
本帖最后由 xioaxu790 于 2014-12-15 13:19 编辑 问题导读 1、Analyzer在Spark SQL里起到了什么作用? 2、如何理解流程是实 ...
问题导读: 1. Spark MLlib 在应用架构中是什么位置? 2. Spark MLlib 中算法怎么分类的? 3. 监督和非监督式学习的异同点? ...
问题导读: 1.什么是MLlib? 2.RDD和MR的区别? MLlib支持本地向量和单机存储的矩阵,或者以一个或多个RDD支持的分 ...
问题导读: 1.SparkContext是什么? 2.SparkContext内部做了什么? SparkContext是什么 SparkContext是在Driver端创建 ...
问题导读 1.哪些方法可以做数据的聚合? 2.集群上进行数据聚合时如何优化? 3.对存储在Map类型中的数据如何排序? 4.scala ...
问题导读:1. Driver 端如何发送 LaunchTask 事件?2. CoarseGrainedSchedulerBackend 的作用是什么?3. Executor 端如何接收Lau ...
问题导读: 1. 如何学习图数据处理和分析? 2. 如何用Apache Spark GraphX库进行图数据分析? 3. 哪些常用的图类算法? 4. ...
本帖最后由 feilong 于 2017-10-13 11:57 编辑 问题导读 1.什么是Spark Shell,SparkContext,REPL? 2.什么是RDD? 3.如 ...
本帖最后由 hero1122 于 2017-7-31 19:07 编辑 问题导读: 1.什么是LDA文档问题模型? 2.LDA 建模算法是什么样的? 3.spa ...
本帖最后由 PeersLee 于 2017-9-27 18:13 编辑 问题导读: 1. 属性 Graph 是什么? 2. Graph 运算符有哪些? 3. Graph 建造 ...
本帖最后由 feilong 于 2017-9-1 17:58 编辑 问题导读 1.实验室中的分析和工厂的分析的区别是什么?2.数据在分析前需要做哪些 ...
问题导读 1.TensorFlowOnSpark的架构与设计包括哪两个基本内容? 2.将TensorFlow集群部署在Spark主要解决什么问题? 3.TensorF ...
问题导读 1.JodaTime和NScalaTime分别是什么?如何使用? 2.Esri Geometry API作用是什么?如何获取?如何使用? 3.样例数 ...
本帖最后由 feilong 于 2018-7-6 12:24 编辑 问题导读 1.如何进行多词查询? 2.怎样使用Spark实现多词查询? 3.奇异值分 ...
问题导读 1.TensorflowOnSpark安装有哪些前提? 2.本文安装遇到了哪些坑? 3.后期遇到了哪些问题,又是如何解决的? ...
问题导读 1、如何理解spark的环境变量传递? 2、Task的派发源起于什么? 上一篇中介绍了Spark的各种运行模式的基本 ...
本帖最后由 pig2 于 2014-9-14 12:43 编辑 问题导读 1、如何保存接收到的数据? 2、如何处理接收到的数据? 3、调用getOrCo ...
问题导读 1.预处理的数据数据格式是怎样的? 2.哪些数据需要预处理?做怎样的处理? 3.预处理代码如何编写的? 关注最 ...
本帖最后由 feilong 于 2018-6-15 09:30 编辑 问题导读 1.什么是奇异值分解? 2.SVD是什么? 3.如何利用MLib得到奇异分解 ...
问题导读 1.什么是顶点的度?为什么需要引入这个概念? 2.Graphx中内置的计算度的方法是什么?如何使用? 3.如何过滤噪声边 ...
本帖最后由 pig2 于 2017-6-15 09:11 编辑 问题导读 1.Spark Streaming提供了哪三种内置的数据源支持? 2.Receiver的作用 ...
问题导读 1、你如何理解转换(Transformations)的含义? 2、Spark实现机器学习算法的流程有哪些? 3、如何利用已有的训练样本 ...
问题导读 1.从哪里获取样例数据? 2.数据的数据结构是怎样的? 3.我们将如何对这些数据进行分析?使用什么工具? 关注 ...
问题导读 1.spark-defaults.conf修改后,会造成哪些影响? 2.spark-env.sh中SPARK_MASTER_IP该如何指定? 3.spark-submit可 ...
本帖最后由 feilong 于 2018-8-31 14:13 编辑 问题导读 1.什么是小世界网路?其数学模型有何特性? 2.如何判定图示完全的 ...
问题导读 1.如何确定权重因子? 2.如何拟合线性模型? 3.如何进行数据抽样? 关注最新经典文章,欢迎关注公众号 ...
问题导读 1.出租车数据中哪些数据可以去除? 2.处理出租车数据时如何使用前几章提到的API? 3.如何分析出租车地理数据? ...
问题导读 1.如何求样例数据中的文件总数? 2.图过滤的规则是什么? 3.如何分析过滤后的数据? 关注最新经典文章,欢迎 ...
本版积分规则 发表帖子
查看 »