用户组:游客
本帖最后由 levycui 于 2019-6-19 20:43 编辑 问题导读: 1、SparkContext 如何创建过程? 2、如何理解Task 执行和回馈? 3 ...
本帖最后由 levycui 于 2019-6-19 19:54 编辑 问题导读: 1、如何理解RPC 网络通信抽象? 2、如何理解Spark 通信架构? 3、 ...
问题导读 1.什么是Spark MLLIB? 2.真正的生产机器学习部署涉及哪些任务? 3.如何使用Spark MLlib进行文本分类? 上 ...
问题导读 1.数据科学家的工作流程是怎样的? 2.Spark文件格式有哪些,如何使用? 3.Spark有哪些子项目,分别是做什么用的? ...
问题导读 1.Spark驱动器和执行器分布有什么用,二者有什么关系? 2.Spark如何序列化,用了什么技术? 3.什么是累加器,如何 ...
问题导读 1.Thunder核心数据类型有哪些? 2.如何用Thunder对神经元类型进行分类? 3.Thunder有哪些功能? Spark 高级 ...
问题导读 1.如何安装Thunder? 2.示例中如何利用Thunder加载数据? 3.什么是像素? 4.如何将结果可视化? Spark 高级 ...
问题导读 1.什么是PySpark? 2.PySpark经常用来做什么? 3.PySpark内部原理是什么? Spark 高级分析:第十章第5节 示例 ...
问题导读 1.如何获取示例数据? 2.要将示例中的数据做哪些操作?如何操作? 3.基因组学中的许多计算是否很好地融入了Spark ...
问题导读 1.本示例中将使用那些细胞数据?如何获取这些数据? 2.要将示例中的原始数据生成什么样的训练集?如何操作? 3.如 ...
问题导读 1.什么是Parquet? 2.Parquet底层原理是什么? 3.如何定义使用谓词类? 上一篇: Spark 高级分析:第十章第2 ...
问题导读 1.什么是ADAM? 2.如何使用ADAM? 3.如何分析结果? 上一篇: Spark 高级分析:第十章第1节 解耦存储与建模 ...
问题导读 1.本章主要目的有哪些? 2.什么是Avro? 3.现有的RPC框架有哪些?有何异同? 关注最新经典文章,欢迎关注公 ...
问题导读 1.如何将返回结果可视化? 2.如何对结果进行评估? 3.蒙特卡洛风险模拟可以用来做什么? 关注最新经典文章, ...
问题导读 1.什么是多元正态分布? 2.将多元正态分布拟合到我们的数据中需要做什么? 3.如何进行数据试验? 关注最新经 ...
问题导读 1.如何确定权重因子? 2.如何拟合线性模型? 3.如何进行数据抽样? 关注最新经典文章,欢迎关注公众号 ...
问题导读 1.预处理的数据数据格式是怎样的? 2.哪些数据需要预处理?做怎样的处理? 3.预处理代码如何编写的? 关注最 ...
问题导读 1.什么是蒙特卡洛风险模型? 2.模型公式是什么? 3.文中从哪里获取股票数据? 关注最新经典文章,欢迎关注公 ...
问题导读 1.什么是VaR?有哪些计算方法? 2.什么是蒙特卡洛模拟? 3.本章都有哪些金融相关术语? 关注最新经典文章,欢 ...
问题导读 1.什么是Spark会话化?如何使用? 2.groupByKeyAndSortValues作用是什么,如何使用? 3.出租车地理数据分析的意义 ...
问题导读 1.出租车数据中哪些数据可以去除? 2.处理出租车数据时如何使用前几章提到的API? 3.如何分析出租车地理数据? ...
问题导读 1.Spark Shell如何新增依赖? 2.文中准备数据做了哪些处理? 3.如何处理不良记录? 关注最新经典文章,欢迎 ...
问题导读 1.GeoJson是什么?如何使用? 2.Spray是什么?如何使用? 3.常用的Scala Collections API方法有哪些? 关注 ...
问题导读 1.JodaTime和NScalaTime分别是什么?如何使用? 2.Esri Geometry API作用是什么?如何获取?如何使用? 3.样例数 ...
问题导读 1.从哪里获取样例数据? 2.数据的数据结构是怎样的? 3.我们将如何对这些数据进行分析?使用什么工具? 关注 ...
问题导读 1.计算图中顶点之间的路径长度是什么样的过程? 2.什么是BSP?什么是Pregel? 3.GraphX中如何计算顶点之间路径长 ...
本帖最后由 feilong 于 2018-8-31 14:13 编辑 问题导读 1.什么是小世界网路?其数学模型有何特性? 2.如何判定图示完全的 ...
问题导读 1.如何求样例数据中的文件总数? 2.图过滤的规则是什么? 3.如何分析过滤后的数据? 关注最新经典文章,欢迎 ...
问题导读 1.什么是顶点的度?为什么需要引入这个概念? 2.Graphx中内置的计算度的方法是什么?如何使用? 3.如何过滤噪声边 ...
问题导读 1.什么是连通图?如何判断? 2.Graphx中内置的计算连通分支的方法是什么?如何使用? 3.判断图是否是连通图对数据 ...
本版积分规则 发表帖子
查看 »