用户组:游客
问题导读: 1. 为什么要建设大数据平台? 2. 大数据平台的业务架构有哪几块? 3. 数据可视化的原因是什么? 4. 数据可视 ...
问题导读 Spark on YARN有哪两种模式? Spark有哪些常用配置? 采用yarn-client方式部署有什么好处? 1:概述 ...
问题导读 1.Scala是如何实现分析商店购买记录的? 2.对比Scala程序与Java程序实现差别? 3.三种语言各有什么特点? ...
[看图说话] 基于Spark UI性能优化与调试——初级篇 Spark有几种部署的模式,单机版、集群版等等,平时单机版在数据量不大的时候 ...
问题导读: 1.怎样训练模型? 2.怎样使用模型?3.怎样进行模型效果评估? 上一篇:Spark机器学习入门2·准 ...
本帖最后由 desehawk 于 2015-4-4 00:49 编辑 问题导读1.Ctrl+F12快捷键完成IntelliJ IDEA什么功能?2. Alt+Home完成IntelliJ ...
问题导读 1.Docker抛弃传统VM试图模拟完整机器的思路,而是以应用为单元进行"集装封箱",有哪些好处? 2.什么让Docker这么 ...
Hadoop MapReduce采用了什么编程模型? 多进程模型有什么缺点? Spark采用了什么编程模型? Spark同节点上的任务以多线程的方 ...
问题导读: 1、Spark算子的作用是什么? 2、什么是Transformation和Actions? 3、算子分类有哪些? Spark算子的作用 ...
问题导读: 1.流式处理框架特征有哪些特征?2.流式处理框架技术需求有哪些?3.怎样把图片文件通过基于 Spark Streaming ...
问题导读 1.读取日志的过程中,发生异常本文是如何解决的? 2.读取后,如何过滤异常的记录? 3.如何实现统计点击最高的记录 ...
问题导读 1.如何进入spark shell? 2.spark shell中如何加载外部文件? 3.spark中读取文件后做了哪些操作? about ...
阅读导读: 1.如何使用Scala编写一个对Apache访问日志的分析器? 2.如何在Linux命令行启动Spark? 3.如何确定一个URL访问页面 ...
需要注意两点:(1)使用的Hadoop必须是2.0系列,比如0.23.x,2.0.x,2.x.x或CDH4、CDH5等,将Spark运行在Hadoop上,本质上是将S ...
问题导读 1.Spark可以在哪三个地方配置系统? 2.如何实现动态加载Spark属性? 相关内容 Spark中文手册-编程指 ...
问题导读 1.input DStream的作用是什么? 2.spark、storm能否并行读取kafka?如何实现并行读取? 3.spark还存在哪些问题,新 ...
本帖最后由 nettman 于 2015-3-31 16:17 编辑 问题导读 1.GraphX提供了几种方式从RDD或者磁盘上的顶点和边集合构造图? 2.P ...
本帖最后由 nettman 于 2015-3-31 16:17 编辑 问题导读 1.什么是GraphX? 2.如何将Spark和GraphX引入到项目中? 3.从一个 ...
问题导读: 1. 京东的供应链是什么样的呢? 2. 预测技术在京东的供应链起着什么样的作用呢? 3. 京东整个预测系统的架构是什 ...
问题导读 1.数据科学是怎么来的? 2.数据科学能做哪些事情? 3.什么是HPC? [*]数以千计的功能和数十亿的 ...
问题导读: 1、什么是DataFrames? 2、什么是DataFrames Schema? 3、Spark 1.2 Sql踩过的坑有哪些? 在spark sql 之 ...
问题导读 1.编译spark源文件的过程中,如何防止内存不足? 2.spark如果没有自己hadoop或则hive版本对应的预构建版本,该如何 ...
本帖最后由 howtodown 于 2014-10-21 21:55 编辑 问题导读 1、你如何理解Storage模块架构? 2、put()函数是如何实现的? ...
问题导读: 1.怎样编译和配置HIVE? 2.怎样配置spark?3.怎样开发spark? 小结结构上Hive On Spark和SparkSQL ...
问题导读: 1.Spark UI的处理流程是什么?2.这样分析现有Executors页面?3.怎样自己编写一个HelloWord页面? 前言有时 ...
问题导读: 1.in-heap 和 off-heap (MemoryAllocator)是什么? 2.内存管理器(MemoryManager)介绍? 3.ExecutorMemoryManager ...
问题导读 1.从哪个版本开始Elasticseach支持spark sql? 2.如何查找Elasticseach和spark sql对应版本? 3.如何实现Spark S ...
问题导读: 1.如何搭建spark二次开发环境? 扩展: 2.spark开发环境与hbase、hadoop开发环境搭建有什么相同之处? 附上: h ...
问题导读: 1.如何Spark任务运行属性? 2.如何配置运行需要的环境变量及运行参数? 简介 Spark的配置系统 ...
本帖最后由 PeersLee 于 2016-4-13 19:01 编辑 问题导读: 1.Spark生态圈是否缺乏一个支持在线学习的流分析算法引擎? 2 ...
本版积分规则 发表帖子
查看 »