用户组:游客
Apache Spark 1.3 发布,1.3 版本引入了期待已久的 DataFrame API,这是 Spark 的 RDD 抽象设计来简单快速支持大数据集的变革。 ...
问题导读1.在传大量数据的情况下,communication manager换成netty-based的实现了,实现这个功能有什么好处?2.Spark SQL中缓存表 ...
问题导读 1.spark1.6做了哪些改变? 2.性能提升做了哪些改进? 3.增加了哪些新的算法和功能? Apache Spa ...
本帖最后由 hyj 于 2015-4-16 00:27 编辑 问题导读 1.Spark将支持在哪些移动设备上运行? 2.目前Android Runtime (ART) 目前 ...
问题导读 1.Spark有哪些模块发生改变? 2.Barrier Execution是什么? 3.将Spark数据与AI整合的是什么项目? 关注最新经 ...
2014年的大数据领域,Apache Spark(以下简称Spark)无疑最受瞩目。Spark,出自名门伯克利AMPLab之手,目前由商业公司Databricks ...
本篇文章思考的问题:为什么Hadoop家族要加入Spark?MapReduce能否改善,MapReduce适合什么场景,是否MapReduce一无是处?Spark ...
问题导读 1.Spark项目是如何发展的? 2.SparkR整合有哪些好处? 3.Spark1.4有哪些新特性? 6月11日(美 ...
Spark2.4.0 今天官网发布,这是一个大好消息。Spark 2.4.0是2.x的第五个发型版本。官方发布消息链接如下:http://spark.apache.o ...
本帖最后由 pig2 于 2015-7-17 00:02 编辑 问题导读: 1、查看到底哪个spark job引起了这个批次的处理时间过长? 2、Job用了 ...
基于Apache Spark 3.1.1的CDS 3.1在CDP Private Cloud Base 7.1.6上正式发布,这是CDS 3的小版本更新发布,主要改进包括: Pa ...
问题导读 1.Apache Spark 1.5性能到底能提升多少呢? 2.DataFrame API方面,实现了哪些新的接口? 3.ML里面增加了哪些新 ...
问题导读 1.IntelliJ IDEA 14.1支持Docker.能带来什么好处? 2.IntelliJ IDEA如何实现支持Docker? 3.Docker平台提供了哪 ...
问题导读1.Apache Spark1.5 DataFrame有哪些变化?2.spark.sql.tungsten.enabled是什么参数?3.Spark内置的expression function ...
导读:1.spark1.2.1修复了哪些方面的bug?2.PySpark方面修复了哪些bug? Spark 1.2.1 发布,此版本是个维护版本,包括 ...
问题导读 1.spark ML持久性的关键特性包括哪些? 2.Apache Spark 2.0为何说为机器学习模型注入持久性? 简 ...
问题导读 1.本文如何用450万条维基百科词条的文档集训练一个话题模型? 2.在线变分预测是一种什么技术? 3.对Spark LDA算 ...
问题导读 1.spark1.3增加了哪些功能? 2.DataFrames可以用来做什么? 3.机器学习库Spark MLlib本文讲的实现了哪些新的学习 ...
本帖最后由 pig2 于 2014-7-10 23:33 编辑 问题导读: 1、Spark的最新版本是什么? 2、Spark的内核组件增加的是什么? 3、 ...
问题导读: 1.spark-submit的作用是什么? 2.如何查看spark-submit的各种命令? 3.spark-submit提交spark应用程序应注意什么 ...
问题导读 1.Spark 3.3 新增了哪些特性? 2.Join查询性能提升最高可提高多少倍? 3.自适应查询执行(AQE)做了哪些改进? ...
问题导读 1.Spark3.1.1是否稳定版? 2.Zen 项目的启动从哪三个方面提高 PySpark 的可用性? 3.为了增强查询性能,做了哪些 ...
问题导读 1、Spark SQL多了一个什么重要的功能? 2、Spark SQ支持哪些关系型查询表达式? Spark1.0出来了,变化还 ...
问题导读 1.如何获取安装最新版本? 2.MLflow 0.4.2 新增了哪些功能? 3.MLflow 0.4.2修复了哪些功能? 关注最新经 ...
问题导读 1.MLflow0.2版本中内置了什么内容? 2.MLflow下一步可能内置哪些机器学习组件? 3.MLflow0.2是否可以在云中运行? ...
本帖最后由 breaking 于 2016-3-10 21:48 编辑 问题导读: 1:spark1.6之前内存怎么管理? 2:spark1.6内存管理UnifiedMem ...
日前,Databricks公司发布了一个Apache Spark主要版本的可用性。除了可用性、可移植性等几个新的特性外,本次发布还提供了对尚 ...
问题导读 1.Docker 1.9版本新增了哪些功能? 2.新版的Docker引擎中加入了哪些新的特性? 3.Compose在版本中新添了哪些加 ...
该版本带来了一些操作性和性能的提升,主要是体现在核心模块上。同时增加新的库 MLlib 和 Spark SQL。支持 Python ,增加新的组 ...
本版积分规则 发表帖子
查看 »