用户组:游客
本帖最后由 pig2 于 2017-2-21 09:48 编辑 问题导读 1.hive/console的作用是什么? 2.hive/console如何安装? 3.hive/con ...
本帖最后由 pig2 于 2015-1-6 14:17 编辑 问题导读 1.构成Standalone cluster部署模式的四大组成部件有哪些?分别有什么 ...
本帖最后由 sehriff 于 2017-9-27 23:06 编辑 问题导读 1.什么是CBO,RBO?2.什么是执行计划?3.什么是join,filter?4.事实表 ...
怎么从web到spark集群 如wordcount,怎么从web应用调用并传参数(如传文件路径啥的)给wordcount? 并取得wordcount的结果 ...
问题导读 1.如何获取样本数据? 2.如何使用Scala解析XML文件? 3.Scala解析XML文件需要导入依赖吗? 上一篇:Sp ...
本帖最后由 levycui 于 2016-10-11 14:53 编辑 问题导读: 1、如何使用Spark shell进行Spark ALS算法实现? 2、如何理解ALS算 ...
问题导读 1.UDF对spark sql的作用是什么? 2.用Scala编写的UDF与普通的Scala函数唯一的区别在什么地方? 3.如何在spark中 ...
本帖最后由 pig2 于 2017-12-15 18:11 编辑 问题导读 1.spark2 sql如何读取json文件? 2.spark2读取json格式文件有什么要 ...
本帖最后由 pig2 于 2017-3-2 15:52 编辑 问题导读 1.你认为缓存的作用是什么? 2.cache与persist的区别是什么? 3.spark ...
问题导读 1.计算图中顶点之间的路径长度是什么样的过程? 2.什么是BSP?什么是Pregel? 3.GraphX中如何计算顶点之间路径长 ...
问题导读 1、涉及shuffle的操作有哪些? 2、如何理解combineByKey的操作流程? 3、flatMapValues作用是什么? 主 ...
问题导读 1.Spark2入门是哪个类? 2.为何要产生Spark-Session? 3.Spark-Session如何使用? 关注最新经典文章,欢迎关注公 ...
问题导读: 1.拿到数据我们怎么去做数据分析? 2.在spark中怎么去做聚类分析? 近期,comSysto公司分享了该公司研 ...
问题导读 1.如何将返回结果可视化? 2.如何对结果进行评估? 3.蒙特卡洛风险模拟可以用来做什么? 关注最新经典文章, ...
问题导读: 1、用什么方式判断空RDD? 2、Spark Streaming与Kafka如何处理空RDD? 在Spark Streaming中,job不断的产生 ...
Apache Spark的广播变量”(Broadcast variable)是什么? 两个文件/目录中的数据非常大,难以将某一个存放到内存中时,Spark如 ...
问题导读: 1.怎样创建StreamingContext?2.怎样Spark Streaming处理数据?3.怎样解决从checkpoint目录读取应用信息,无法初 ...
本帖最后由 sunshine_junge 于 2014-7-7 21:51 编辑 问题导读: 1.什么是RDD? 2.如何实现RDD转换? 1、 ...
本帖最后由 不会飞的小凯凯 于 2015-12-18 22:36 编辑 问题导读: 1.Spark内核有什么特性? 2.什么叫做RDD? 3.DAG和Stag ...
问题导读 1.本文中处理的数据量是多少? 2.Spark如何处理这些数据的? 3.Spark处理数据,作者做了哪些分析和讲解? 问 ...
本帖最后由 不会飞的小凯凯 于 2015-11-20 16:17 编辑 问题导读: 1.什么是Spark微服务? 2.如何进行微服务实时性能 ...
本帖最后由 feilong 于 2017-10-27 09:58 编辑 问题导读 1.什么是Tuples?什么是case class? 2.什么是隐式类型转换? 3. ...
本帖最后由 levycui 于 2018-9-4 20:56 编辑 问题导读: 1、什么是 ETL? 2、如何理解离线 ETL 的架构设计及实现原理? 3、 ...
问题导读 1、Hadoop有哪些诸多局限性? 2、相比MapReduce,Spark在这些需求中有哪些优势? 3、如何看待spark? 20 ...
问题导读: 1.怎样把不同天的数据分离导入到不同天的es索引里面?2.有哪几种方式可以不同天的数据分离导入到不同天的es索引 ...
问题导读 1.Spark项目是如何发展的? 2.SparkR整合有哪些好处? 3.Spark1.4有哪些新特性? 6月11日(美 ...
问题导读 1.这本书是关于什么的? 2.这本书里有什么? 3.什么情况下,使用书中样例代码无需授权? 前言 我 ...
问题导读 1.hive/console能做什么? 2.hive/console原理是什么? 3.hive/console有哪些常用操作? 4.如何查看运行计划 ...
问题导读 1.如何通过intellij idea 实现导出可执行jar包?2.导出可执行jar包包含哪些步骤? 最近开始转到intellij ide ...
问题导读 1.Apache Spark 1.5性能到底能提升多少呢? 2.DataFrame API方面,实现了哪些新的接口? 3.ML里面增加了哪些新 ...
本版积分规则 发表帖子
查看 »