用户组:游客
本帖最后由 pig2 于 2014-3-16 23:01 编辑 我们知道了什么是Thrift(让你真正明白到底什么是thrift),那么如何使用Thrift。可以 ...
1.YARN模式由谁来作为客户端提交作业给YARN? 2.SPARK_HADOOP_VERSION=2.2.0 SPARK_YARN=true ./sbt/sbt assembly的作用是什么 ...
问题导读: 1.你认为Hadoop适用什么场景? 2.Spark适用于什么场景? 3.HBase与 Redis各有什么特点? 最近在网上 ...
在hadoop的安装过程中,对于一些常见的错误,我们已经做了修改,关键是它不报任何的错误。这让我们摸不着头脑。这里总结一下: ...
1)NameNode、DataNode和Client NameNode可以看作是分布式文件系统中的管理者,主要负责管理文件系统的命名空间、 ...
[*]存储极大数目的信息(terabytes or petabytes),将数据保存到大量的节点当中。支持很大单个文件。 [*]提供数据的高可靠性 ...
在初期,我们采用的逻辑是:将A表中的数据读取一行,根据其中的某个字段去组织一个GET,然后立刻提交,从B表取得要查询的字段的 ...
1 HDFS体系结构简介及优缺点 1.1体系结构简介 HDFS是一个主/从(Mater/Slave)体系结构,从最终用户的角度来看,它就像传统 ...
Hadoop在淘宝和支付宝的应用从09年开始,用于对海量数据的离线处理,例如对日志的分析,也涉及内容部分,结构化数据等。使用Hado ...
问题导读 1.经常执行HDFS文件系统检查工具有哪些? 2.设置元数据与数据的存储路径都有哪些属性? 3.一旦数据发生异常,该 ...
问题导读 1.自定义修改hadoop/conf/log4j.properties,需要添加哪些内容? 2.需要修改那个类? 3.修改后,如何生效? ...
问题导读 1.hadoop2.x集群安装准备工作是否都是一样的?都需要哪些准备? 2.hadoop2.x各个版本集群安装是否通用? 3.hadoo ...
[*]大数据量存储:分布式存储 [*]日志处理: Hadoop擅长这个 [*]海量计算: 并行计算 [*]ETL:数据抽取到oracle、mysql、DB2 ...
本帖最后由 pig2 于 2015-3-13 21:25 编辑 导读本文除了一些常用的大数据工具,还总结汇总了其他大数据工具,几乎是最全的大数 ...
问题导读 1、为什么要做用户画像呢? 2、怎么做,做好了后用户画像怎么用? 为什么要做用户画像? 一 ...
本帖最后由 pig2 于 2014-6-9 23:39 编辑 正如大家所知,NameNode在Hadoop系统中存在单点故障问题,这个对于标榜高可用性的Had ...
本帖最后由 howtodown 于 2014-8-21 22:32 编辑 问题导读: 1.hadoop历史服务器的作用是什么? 2.如何启动历史服务器? 3. ...
问题导读 1.外部的应用程序需要操作HDFS的情况,该如何解决? 2.WebHDFS REST API可以完成什么事情? 3.Httpfs 配置启动,c ...
阅读本文首先知道什么是YARN,如果不清楚,可以查看为什么会产生yarn,它解决了什么问题,有什么优势 可以带着下面问题来阅读本 ...
问题导读 1.Impala与Hive是什么关系? 2.Impala的查询处理包含哪些过程? 3.Impala与Hive有哪些相同点? 1. I ...
第一部分:什么是HDFS Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。 HDFS是高容错性的,可以部署 ...
问题导读 1.什么是Ambari? 2.Ambari项目是由哪几部分构成的? 3.Ambari系统架构是如何组成的? 前言Hadoop集 ...
Hadoop 文件系统shell使用命令介绍,基本上所有的命令与linux命令相差不大,下面为我的hadoop系统文件夹 查看命令:hadoop fs - ...
阅读本文可以带着下面问题 1.reduce数量由谁来决定? 2.运行作业的工具由哪些? 更多问题等待你挖掘 MapReduce的 ...
问题导读 1.Cloudera Search的作用是什么? 2.如何全文搜索hadoop? Cloudera Search的推出,对于曾经做信息 ...
本帖最后由 pig2 于 2014-5-19 15:32 编辑 1、Hive架构与基本组成 下面是Hive的架构图。图1.1 Hive体系结构 Hive ...
问题导读 1.本地模式与Yarn模式配置有什么区别? 2.Yarn模式有哪两种方式执行任务? 3.uber mode与mr小作业是什么关系? ...
问题导读 1.hadoop简单模式如何认证? 2.kerberos认证存在什么问题? 1.简单模式 这种模式,配置简单,使 ...
本帖最后由 desehawk 于 2015-3-13 15:15 编辑 下面是文档简版,收集整理者为Aquester下面是对各种开源大数据工具的一个 ...
问题导读 1.hadoop压缩有哪些好处? 2.不同的压缩算法拥有哪些不同的压缩特性? 3.CompressionCodec有哪两个方法可以帮助我 ...
本版积分规则 发表帖子
查看 »