用户组:游客
问题导读 1.Spark 中堆内内存是如何进行规划的?2.Spark 对堆内内存的管理的具体流程是怎样的?3.Spark 能否完全避免内存溢出 ...
问题导读 1.spark的执行原理包含哪些内容? 2.本文分享了哪些调优经验? 3.shuffle如何调优? 1:本文主讲的是client模 ...
问题导读 1.尽量用reduceByKey,不要用groupByKey,为什么? 2.reduceByKey和groupByKey区别与用法? 3.如何实现去重? ...
问题导读 1.什么是Spark MLLIB? 2.真正的生产机器学习部署涉及哪些任务? 3.如何使用Spark MLlib进行文本分类? 上 ...
问题导读 1.本文中处理的数据量是多少? 2.Spark如何处理这些数据的? 3.Spark处理数据,作者做了哪些分析和讲解? 问 ...
问题导读 1.数据科学家的工作流程是怎样的? 2.Spark文件格式有哪些,如何使用? 3.Spark有哪些子项目,分别是做什么用的? ...
问题导读 1.Spark驱动器和执行器分布有什么用,二者有什么关系? 2.Spark如何序列化,用了什么技术? 3.什么是累加器,如何 ...
问题导读 1.Thunder核心数据类型有哪些? 2.如何用Thunder对神经元类型进行分类? 3.Thunder有哪些功能? Spark 高级 ...
问题导读 1.如何安装Thunder? 2.示例中如何利用Thunder加载数据? 3.什么是像素? 4.如何将结果可视化? Spark 高级 ...
问题导读 1.什么是PySpark? 2.PySpark经常用来做什么? 3.PySpark内部原理是什么? Spark 高级分析:第十章第5节 示例 ...
问题导读 1.如何获取示例数据? 2.要将示例中的数据做哪些操作?如何操作? 3.基因组学中的许多计算是否很好地融入了Spark ...
问题导读 1.本示例中将使用那些细胞数据?如何获取这些数据? 2.要将示例中的原始数据生成什么样的训练集?如何操作? 3.如 ...
问题导读 1.什么是Parquet? 2.Parquet底层原理是什么? 3.如何定义使用谓词类? 上一篇: Spark 高级分析:第十章第2 ...
问题导读 1.什么是ADAM? 2.如何使用ADAM? 3.如何分析结果? 上一篇: Spark 高级分析:第十章第1节 解耦存储与建模 ...
问题导读 1.本章主要目的有哪些? 2.什么是Avro? 3.现有的RPC框架有哪些?有何异同? 关注最新经典文章,欢迎关注公 ...
问题导读 1.如何将返回结果可视化? 2.如何对结果进行评估? 3.蒙特卡洛风险模拟可以用来做什么? 关注最新经典文章, ...
问题导读 1.什么是多元正态分布? 2.将多元正态分布拟合到我们的数据中需要做什么? 3.如何进行数据试验? 关注最新经 ...
问题导读 1.如何确定权重因子? 2.如何拟合线性模型? 3.如何进行数据抽样? 关注最新经典文章,欢迎关注公众号 ...
Spark2.4.0 今天官网发布,这是一个大好消息。Spark 2.4.0是2.x的第五个发型版本。官方发布消息链接如下:http://spark.apache.o ...
问题导读 1.预处理的数据数据格式是怎样的? 2.哪些数据需要预处理?做怎样的处理? 3.预处理代码如何编写的? 关注最 ...
问题导读 1.什么是蒙特卡洛风险模型? 2.模型公式是什么? 3.文中从哪里获取股票数据? 关注最新经典文章,欢迎关注公 ...
问题导读 1.为什么要在Kubernetes上运行Kafka? 2.Kafka在Kubernetes需要注意哪些问题? 3.在Kubernetes上的部署Kafka时, ...
问题导读 1. Spark On Yarn 下executor-memory 参数如何生效? 2. Cluster 和 Client 模式中 内存开销的区别? 3. 规整化因子 ...
问题导读 1.什么是VaR?有哪些计算方法? 2.什么是蒙特卡洛模拟? 3.本章都有哪些金融相关术语? 关注最新经典文章,欢 ...
问题导读 1.什么是Spark会话化?如何使用? 2.groupByKeyAndSortValues作用是什么,如何使用? 3.出租车地理数据分析的意义 ...
问题导读 1.Spark2入门是哪个类? 2.为何要产生Spark-Session? 3.Spark-Session如何使用? 关注最新经典文章,欢迎关注公 ...
问题导读 1.出租车数据中哪些数据可以去除? 2.处理出租车数据时如何使用前几章提到的API? 3.如何分析出租车地理数据? ...
问题导读 1.Spark Shell如何新增依赖? 2.文中准备数据做了哪些处理? 3.如何处理不良记录? 关注最新经典文章,欢迎 ...
问题导读 1.GeoJson是什么?如何使用? 2.Spray是什么?如何使用? 3.常用的Scala Collections API方法有哪些? 关注 ...
问题导读 1.从哪个版本开始Elasticseach支持spark sql? 2.如何查找Elasticseach和spark sql对应版本? 3.如何实现Spark S ...
本版积分规则 发表帖子
查看 »