用户组:游客
问题导读 1.Spark Shell如何新增依赖? 2.文中准备数据做了哪些处理? 3.如何处理不良记录? 关注最新经典文章,欢迎 ...
问题导读 1.如何将返回结果可视化? 2.如何对结果进行评估? 3.蒙特卡洛风险模拟可以用来做什么? 关注最新经典文章, ...
问题导读 1、如何了解Spark的功能? 2、什么是Spark aggregate? Spark的官方文档其实说得并不是明了,很多内容如果 ...
问题导读 1.什么是多元正态分布? 2.将多元正态分布拟合到我们的数据中需要做什么? 3.如何进行数据试验? 关注最新经 ...
问题导读 1.如何使用Spark实现K-Means聚类? 2.K-Means聚类对输入有何要求? 3.如何查看聚类结果? 上一篇:Spa ...
问题导读 1.什么是VaR?有哪些计算方法? 2.什么是蒙特卡洛模拟? 3.本章都有哪些金融相关术语? 关注最新经典文章,欢 ...
问题导读 1.如何确定权重因子? 2.如何拟合线性模型? 3.如何进行数据抽样? 关注最新经典文章,欢迎关注公众号 ...
问题导读 1.spark有哪些使用场景? 2.spark有包含哪些组件? 3.spark在哪些厂商已经应用? 4.spark如何实现地震检测? ...
Spark2.4.0 今天官网发布,这是一个大好消息。Spark 2.4.0是2.x的第五个发型版本。官方发布消息链接如下:http://spark.apache.o ...
问题导读 1.预处理的数据数据格式是怎样的? 2.哪些数据需要预处理?做怎样的处理? 3.预处理代码如何编写的? 关注最 ...
问题导读 1.什么是蒙特卡洛风险模型? 2.模型公式是什么? 3.文中从哪里获取股票数据? 关注最新经典文章,欢迎关注公 ...
问题导读 1、如何基于用户协同过滤的?2、使用idea是如何打包的?3、UserBase推荐算法主要做哪些工作?4、如何运行jar?5、运 ...
问题导读 1.为什么要在Kubernetes上运行Kafka? 2.Kafka在Kubernetes需要注意哪些问题? 3.在Kubernetes上的部署Kafka时, ...
问题导读 1. Spark出现问题如何定位? 2. Spark日志中,各种状态的意义? 3. Spark任务都有哪几个耗时阶段? 4. Spark任务如 ...
本帖最后由 levycui 于 2016-9-6 10:07 编辑 问题导读: 1、Spark Job Stage划分算法有哪些? 2、Task最佳计算位置算法如何 ...
问题导读 1.什么是Spark会话化?如何使用? 2.groupByKeyAndSortValues作用是什么,如何使用? 3.出租车地理数据分析的意义 ...
问题导读 1.如何创建rdd? 2.什么是pair rdd? 3.如何获取数组指定列? 4.foreachRDD的作用是什么? 本文来自 ...
问题导读 1.Spark2入门是哪个类? 2.为何要产生Spark-Session? 3.Spark-Session如何使用? 关注最新经典文章,欢迎关注公 ...
问题导读 1.出租车数据中哪些数据可以去除? 2.处理出租车数据时如何使用前几章提到的API? 3.如何分析出租车地理数据? ...
问题导读 1.GeoJson是什么?如何使用? 2.Spray是什么?如何使用? 3.常用的Scala Collections API方法有哪些? 关注 ...
问题导读 1.Spark有哪些模块发生改变? 2.Barrier Execution是什么? 3.将Spark数据与AI整合的是什么项目? 关注最新经 ...
本帖最后由 desehawk 于 2018-1-16 10:18 编辑 问题导读 1.Spark SQL在大规模数据集上遇到的哪些问题? 2.自适应执行的背 ...
问题导读 1.从哪个版本开始Elasticseach支持spark sql? 2.如何查找Elasticseach和spark sql对应版本? 3.如何实现Spark S ...
问题导读 1. 分布式矩阵是什么? 2. 在Spark中如何使用分布式矩阵? 3. 使用分布式矩阵的坑? 关注最新经典文章,欢 ...
问题导读 1.JodaTime和NScalaTime分别是什么?如何使用? 2.Esri Geometry API作用是什么?如何获取?如何使用? 3.样例数 ...
问题导读: 1.常用的推荐算法有哪些?2.推荐系统是什么样的流程?3.从这个推荐系统我们能学到什么? 推荐算法就是利用用 ...
问题导读 1.从哪里获取样例数据? 2.数据的数据结构是怎样的? 3.我们将如何对这些数据进行分析?使用什么工具? 关注 ...
问题导读 1.计算图中顶点之间的路径长度是什么样的过程? 2.什么是BSP?什么是Pregel? 3.GraphX中如何计算顶点之间路径长 ...
本帖最后由 pig2 于 2018-9-3 20:03 编辑 问题导读 1.本文的环境是什么? 2.如何打断点? 3.查看变量的数据有几种方式? ...
问题导读: 1.公安实时运维平台整体架构是怎样的?2.Logstash有哪些作用?3.Spark处理分析分为哪几步? 公安行 ...
本版积分规则 发表帖子
查看 »