用户组:游客
作为个人经验总结: 比如 RDD 缓存分布不均匀 是影响spark 的很大的性能之一,为什么这么说? spark调优是需要 ...
本帖最后由 坎蒂丝_Swan 于 2014-12-30 12:28 编辑 1、存储系统 如果可以的话,把Spark的hadoop的节点安装在一起, ...
本帖最后由 坎蒂丝_Swan 于 2014-12-29 16:07 编辑 问题导读 1.创建Dstream的时候有什么要注意的地方? 2.对于调优 ...
问题导读 学习在Spark Streaming下如何自定义Receivers? 自定义一个Receiver An Actor as Rece ...
问题导读: 1.Spark如何部署到yarn? 2.Spark如何基于Scala进行开发? 下载 虽然Spark已经提供了针对Hadoop1 ...
本帖最后由 xioaxu790 于 2014-11-12 21:27 编辑 问题导读 1、如何执行Spark的jar文件? 2、如何在解释器环境下测试Spark呢 ...
问题导读 1、什么是MLlib? 2、什么方法默认执行L2正规化算法? 3、如何理解二元分类? MLlib是的Spark实现一 ...
问题导读: 1.Master如何根据启动参数决定不同重启策略? 2.CuratorFramework实现Zookeeper的高可用? ...
问题导读: 1.如何使用maven对Spark进行构建? 2.如何使用maven对Spark进行编译? 系统环境: 引 ...
问题导读: 1.spark-submit的作用是什么? 2.如何查看spark-submit的各种命令? 3.spark-submit提交spark应用程序应注意什么 ...
问题导读: 1.Spark、Shark集群环境配置? 2.集群各种脚本写法? 1.部署环境 2.Spark集群 ...
问题导读: 1.SparkSQL的环境配置? 2.SparkSQL遇到问题及解决方案? 1.环境 2.Spark集群规划 ...
问题导读 1、如何根据实际场合对Spark进行配置优化? 2、Storage相关配置参数有哪些? 随着Spark的逐渐成熟完善, ...
问题导读 1、什么是线性回归算法? 2、可用线性回归算法有哪些? 3、如何对拟合优度进行评估? 1 什么是线性 ...
问题导读 1、统计分析程序需要实现哪几个功能点? 2、要分析某网站的访问日志信息思路怎样? 3、怎样通过Web控制台来查看当前 ...
问题导读1.如何通过Parser把sql解析成一个LogicPlan?2.child.execute()执行子节点的execute来返回数据的过程是怎样的? ...
本帖最后由 pig2 于 2014-12-21 22:07 编辑 问题导读 1.spark独立部署如何访问hadoop集群数据? 2.spark有哪些启动脚本? ...
问题导读1.Spark与Hadoop MapReduce相比较有何优劣?2.如何使用Spark SQL分析数据? 去年网上曾放出个2000W的 ...
问题导读 1.org.apache.spark.mllib.tree.RandomForest.scala中RandomForest里面的train做了什么? 2.DecisionTree.findSpl ...
本帖最后由 pig2 于 2015-1-6 14:13 编辑 问题导读 1、如何直接将spark在yarn上面运行? 2、结合yarn,需要修改Hadoop哪些配 ...
本帖最后由 pig2 于 2015-1-6 14:12 编辑 问题导读 1.Spark编译需要哪些软件? 2.Spark编译命令是什么? 3.修改代码 ...
本帖最后由 pig2 于 2015-1-6 14:12 编辑 问题导读 1、如何实现Spark在Yarn平台上的部署? 2、如何理解spark在提交时,所做 ...
本帖最后由 pig2 于 2015-1-6 14:12 编辑 问题导读 1、组成cluster的两大元素有哪些? 2、实现HA的原理是什么? 3、为什么S ...
本帖最后由 pig2 于 2015-1-6 14:11 编辑 问题导读 1、本地读取和远程读取有什么区别? 2、什么是TachyonStore? 3、什么是 ...
本帖最后由 pig2 于 2015-1-6 14:10 编辑 问题导读 1、流数据的特点是什么? 2、数据的存储有是被什么触发的? 3、如何理解 ...
本帖最后由 pig2 于 2015-1-6 14:09 编辑 问题导读 1、使用什么指令运行ocal-cluster模式? 2、TaskRunner中执行的task其业 ...
问题导读: 1.启动spark的原理是什么? 2.启动spark-shell需要申请什么资源? 本篇是对Spark1.0.0 运行架 ...
storm、spark 到底有啥本质区别
问题导读: 1.spark RDD的transformation和action的作用是什么? 2.spark RDD的transformation和action能够如何组合? ...
问题导读 1、Spark SQL 的内存数据是如何组织的? 2、如何优化内存数据库的存储结构? 3、优化Spark SQL 和 Shark 有哪些方法 ...
本版积分规则 发表帖子
查看 »