用户组:游客
本帖最后由 pig2 于 2017-3-21 07:33 编辑 问题导读 1.为什么使用spark streaming? 2.什么是StreamingContext? 3.什么 ...
本帖最后由 pig2 于 2017-12-6 14:02 编辑 问题导读 1.你认为SparkContext的作用是什么? 2.SQLContext 和HiveContext的区 ...
问题导读 1.spark-submit各个参数的含义是什么? 2.集群启动都包含哪些脚本? 3.如何实现连接一个应用程序到集群中? ...
问题导读:1.大数据有哪四大特征?2.Spark和Hadoop有什么不同呢?3.Spark的适用哪些场景?4.RDD的生成有哪两种创建方式?5.Spark ...
问题导读 1.Spark Summit更名为什么名字? 2.Spark集群在哪些名企应用? 3.Spark Summit的相关视频和ppt在哪可以下载? ...
本帖最后由 feilong 于 2017-11-24 09:36 编辑 问题导读 1.什么是协同过滤? 2.什么是ALS?原理是什么? 3.?Spark MLib ...
本帖最后由 feilong 于 2017-10-27 09:58 编辑 问题导读 1.什么是Tuples?什么是case class? 2.什么是隐式类型转换? 3. ...
问题导读 1.写一个Spark程序包括哪几点? 2.文中称之为“记录链接”的是什么? 3.记录链接难点在哪儿? 上一篇 ...
本帖最后由 feilong 于 2018-3-2 15:05 编辑 问题导读 1.什么是异常检测?有什么作用? 2.什么是聚类? 3.什么是K-Means ...
问题导读 1.什么是随机决策决策森林? 2.如何做预测? 3.Spark实现了哪几种分类算法? 上一篇:Spark 高级分析: ...
问题导读: 1、如何理解Driver HA? 2、Driver失败如何实现恢复机制? 3、如何使用ReliableKafkaReceiver类型来实现可靠的数 ...
本帖最后由 sehriff 于 2017-10-3 11:46 编辑 问题导读1.机器学习算法可以分成哪些类型?2.为什么python适合机器学习?3.什么是P ...
问题向导: (1)MLlib的提供了哪些相关性计算方法? (2)假设检验是什么? 上一篇Spark机器学习库(MLlib)指南之1:简介 http:/ ...
本书的其余部分不会是关于Spark的优缺点。 还有一些其他的东西,它也不会介绍。 本书将介绍Spark编程模型和Scala基础 ...
问题导读 1.数据科学是怎么来的? 2.数据科学能做哪些事情? 3.什么是HPC? [*]数以千计的功能和数十亿的 ...
问题导读: 1. 京东的供应链是什么样的呢? 2. 预测技术在京东的供应链起着什么样的作用呢? 3. 京东整个预测系统的架构是什 ...
本帖最后由 nettman 于 2015-3-31 16:17 编辑 问题导读 1.什么是GraphX? 2.如何将Spark和GraphX引入到项目中? 3.从一个 ...
问题导读: 1、为什么要使用Apache Spark? 2、Spark如何工作? 3、如何安装Spark? 4、什么是弹性分布式数据集RDD? ...
本帖最后由 nettman 于 2015-3-31 16:17 编辑 问题导读 1.GraphX提供了几种方式从RDD或者磁盘上的顶点和边集合构造图? 2.P ...
问题导读 1.input DStream的作用是什么? 2.spark、storm能否并行读取kafka?如何实现并行读取? 3.spark还存在哪些问题,新 ...
问题导读 1.Spark可以在哪三个地方配置系统? 2.如何实现动态加载Spark属性? 相关内容 Spark中文手册-编程指 ...
本帖最后由 howtodown 于 2014-11-4 14:52 编辑 问题导读 1.在Spark中提供了一个JdbcRDD类,该RDD就是读取JDBC中的数据并转换 ...
本版积分规则 发表帖子
查看 »