用户组:游客
本帖最后由 pig2 于 2017-8-24 22:01 编辑 问题导读 1.如何使用IntelliJ IDEA创建sbt项目? 2.sbt项目需要做哪些设置,才 ...
问题导读: 1.Spark在机器学习算法的实现上有哪些问题?2.Spark on Angel是如何解决Spark在机器学习任务中遇到的瓶颈?3.Spa ...
本帖最后由 pig2 于 2017-8-24 22:01 编辑 问题导读 1.sbt在IntelliJ IDEA里面比较慢,该如何解决? 2.如何在window里面更 ...
本帖最后由 pig2 于 2014-9-28 21:09 编辑 问题导读 1、如何方便、快速、有效得在Eclipse下编译打包Scala应用程序? 2、怎 ...
本帖最后由 hero1122 于 2017-7-31 19:07 编辑 问题导读: 1.什么是LDA文档问题模型? 2.LDA 建模算法是什么样的? 3.spa ...
问题导读: 1.怎样把不同天的数据分离导入到不同天的es索引里面?2.有哪几种方式可以不同天的数据分离导入到不同天的es索引 ...
1.Spark程序在本地调试会大大加快Spark程序的开发。 2.此贴整理了Spark程序本地配置的步骤 相关的资料文件可以到:http://no ...
问题导读: 1. Broadcast Join 如何实现? 2. Shuffle Hash Join 如何实现? 3. Sort Merge Join 如何实现? 引言 ...
本帖最后由 hero1122 于 2017-7-17 16:32 编辑 1.概述 首先,笔者要先申明,我也是初学机器学习领域的内容,虽然我是从事 ...
本帖最后由 desehawk 于 2015-6-8 18:59 编辑 问题导读 1.spark1.3.1默认不支持Hive,该如何解决? 2.如何编译spark? 3.Hi ...
问题导读: 1.怎样编译和配置HIVE? 2.怎样配置spark?3.怎样开发spark? 小结结构上Hive On Spark和SparkSQL ...
问题导读: 1.如何使用spark查询特定范围的hbase的数据? 2.如何把hbase的数据转换成RDD? 3.如何组装scan对象? 最近 ...
本帖最后由 levycui 于 2016-10-11 14:53 编辑 问题导读: 1、如何使用Spark shell进行Spark ALS算法实现? 2、如何理解ALS算 ...
本帖最后由 不会飞的小凯凯 于 2016-6-24 16:34 编辑 问题导读: 1.Spark和ElasticSearch怎么解决实时计算瓶颈? 2.Akka和El ...
问题导读 1.rdd,dataframe,dataset在哪个版本被引入? 2.什么情况下使用rdd,dataframe,dataset? 3.它们有什么不同? ...
问题导读: 1. 如何学习图数据处理和分析? 2. 如何用Apache Spark GraphX库进行图数据分析? 3. 哪些常用的图类算法? 4. ...
本帖最后由 PeersLee 于 2017-5-3 11:42 编辑 问题导读: 1. 堆内和堆外的内存如何规划? 2. 内存空间如何分配? 3. 存储内 ...
问题导读: 1.怎样训练模型? 2.怎样使用模型?3.怎样进行模型效果评估? 上一篇:Spark机器学习入门2·准 ...
本帖最后由 xioaxu790 于 2015-2-6 22:17 编辑 问题导读 1、什么是Consumer Rebalance? 2、如何理解消息Deliver guarantee ...
本帖最后由 pig2 于 2014-7-11 00:52 编辑 问题导读: 1.spark是运行在什么平台的软件? 2.如何搭建开发环境? 3.spark调试 ...
问题导读: 1、kafka是什么? 2、如何使用spark读取kafka中数据? 3、如何使用spark往kafka中写数据? 4、 如何处理端到 ...
本帖最后由 Tank_2000 于 2017-5-4 21:16 编辑 问题导读: 1.spark-submit 命令都有哪些参数可以设置? 2.如何合理设置spa ...
问题导读 1、什么是SparkContext? 2、如何配置Parquet? 3、如何高效的从Apache Hive中读出和写入数据? 本 ...
问题导读: 1.Scala函数参数传值调用? 2.Scala函数参数传名调用? 引言 Scala的解释器在解析函数参数(fun ...
问题导读: 1.RDD的本质是什么?2.Shuffle的本质是什么?3.为什么Shuffle 容易导致Spark挂掉? 前言很多初 ...
本帖最后由 pig2 于 2015-12-14 21:23 编辑 问题导读: 1.基于 Spark 做 Spark Streaming 的思路是什么? 2.Spark Streami ...
问题导读: 1、spark job的生成和运行是怎样的? 2、如何编译spark? 3、kafka和sparkstreaming怎样结合? 集群概述 ...
问题导读: 1. Spark MLlib 在应用架构中是什么位置? 2. Spark MLlib 中算法怎么分类的? 3. 监督和非监督式学习的异同点? ...
借hbase-rdd二次开发谈谈如何在Spark Core之上扩建自己的模块 hbase-rdd是一个构建在SparkContext基础之上的用于 ...
本帖最后由 xuanxufeng 于 2017-4-4 15:03 编辑 问题导读 1.什么是KMeans? 2.KMeans算法可以用来做什么? 3.KMeans如何 ...
本版积分规则 发表帖子
查看 »