用户组:游客
[看图说话] 基于Spark UI性能优化与调试——初级篇 Spark有几种部署的模式,单机版、集群版等等,平时单机版在数据量不大的时候 ...
问题导读 1.你认为如何初始化spark sql? 2.不同的语言,实现方式都是什么? 3.spark sql语句如何实现在应用程序中使用? ...
问题导读 1.Scala是如何实现分析商店购买记录的? 2.对比Scala程序与Java程序实现差别? 3.三种语言各有什么特点? ...
本帖最后由 desehawk 于 2017-1-23 18:11 编辑 问题导读 1.训练分类模型是如何实现的? 2.如何使用分类模型? 3.如何实现评 ...
本帖最后由 PeersLee 于 2017-1-18 11:50 编辑 问题导读: 1. 如何搭建准备环境? 2. 如何搭建运行环境? 3. 如何处理数据 ...
本帖最后由 Oner 于 2016-12-29 10:42 编辑 问题导读:1. spark-jobserver有哪些特性?2. 如何安装spark-jobserver?3. 如何使 ...
本帖最后由 howtodown 于 2016-5-16 16:50 编辑 问题导读 1.如何判断发生数据倾斜? 2.为什么会发生数据倾斜? 3.如何定 ...
本帖最后由 howtodown 于 2015-3-24 16:34 编辑 问题导读 1.SQL语句在实际的运行过程中是怎么处理的呢? 2.sparkSQL的有哪 ...
问题导读: 1.Spark调优有哪些原则?2.Spark作业原理是什么?3.怎样进行参数调优? 前言在大数据计算领域,Spark已 ...
问题导读 1.spark下载方式有哪些? 2.spark可以运行在哪些系统? 3.spark支持哪些语言? 4.如何运行spark各种语言版本例 ...
[大数据之Spark]——Transformations转换入门经典实例 Spark相比于Mapreduce的一大优势就是提供了很多的方法,可以直接使用;另 ...
问题导读 1.spark编程中print内容,在控制台是否能看到?2.输出的日志有哪两种?3.如何才能看到spark运行日志? 比如,Spark ...
问题导读:1.RDD支持哪些操作?2.什么是Shuffle?3.怎样用Scala写spark程序? RDD 操作介绍RDD 有两种操作方式的概念 ...
问题导读: 1.RDD是什么?2.如何选择存储级别?3.什么是并行集合? Spark 的一切都是建立在RDD这个抽象概念之上,而 ...
本帖最后由 xuanxufeng 于 2016-8-11 18:03 编辑 问题导读 1.Spark Streaming 的作用是什么? 2.Spark Streaming工作原理 ...
问题导读 1.sqlContext有哪些关键的概念和组件? 2.LogicalPlan里维护着什么方面的数据? 3.LogicalPlan有哪三种类型? 4. ...
问题导读: 1.Eclipse如何集成Scala开发插件进行开发? 2.如何使用Intellij IDEA进行开发? 引言 在 ...
hbase-rdd二次开发 [*]创建: 张敏,最新修改: 昨天3:41 下午 hbase-rdd是一个构建在SparkContext基础之上的用于对 ...
问题导读: 1、Spark SQL操作流程有哪些? 2、如何加载/保存数据源? 3、保存模式有哪些? 首先看看从官网学习后总结 ...
本帖最后由 xuanxufeng 于 2016-6-9 14:21 编辑 问题导读 1.什么是dataset? 2.本文认为DataSet和RDD主要的区别是是什么? ...
本帖最后由 Oner 于 2016-6-3 08:37 编辑 问题导读: 1. Spark MLlib 在应用架构中的位置是怎样的? 2. Spark MLlib 算法可 ...
问题导读: 1. JVM分为哪几种? 2. 如何监测垃圾回收? 3. 如何优化executor内存比例 4. 更高级的垃圾回收调优有哪些? ...
问题导读: 1.什么是Parquet?2.Hbase怎样转换为Parquet? 列式存储布局(比如 Parquet)可以加速查询,因为它只检查 ...
问题导读: 1.什么是MLBase? 2.MLbase机器学习算法的流程? 3.Scala实现KMeans算法? 1.什么是MLBase ML ...
本帖最后由 PeersLee 于 2016-4-13 19:01 编辑 问题导读: 1.Spark生态圈是否缺乏一个支持在线学习的流分析算法引擎? 2 ...
本帖最后由 breaking 于 2016-3-31 14:56 编辑 问题导读: 1.Spark Sql UDF怎么使用? 2.案例分析使用过程? S ...
问题导读: 1.Spark交互式Shell如何使用? 2.更多RDD操作有什么? 3.缓存机制是怎样的? 本文 ...
问题导读: 1.什么是Spark Streaming?2.怎样配置并运行Spark Streaming?3.怎样调优Spark Streaming? Spark Stream ...
问题导读 1.本文认为SQLContext的作用是什么? 2.DataFrames对外DSL接口有哪些? 3.如何运行sql? Base on spar ...
问题导读 1.Spark中RDD是什么? 2.Spark支持哪两种类型的共享变量? 3.如何将一些Spark的类和隐式转换导入到程序中? 4. ...
本版积分规则 发表帖子
查看 »