分享

Apache、CDH和Cloudera三者有什么区别?

InSight 发表于 2014-10-9 18:14:05 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 13 189923
本帖最后由 InSight 于 2014-10-9 18:15 编辑


    ApacheCDHCloudera三者有什么区别

                 尽可能的从多方面解答。感谢!

已有(13)人评论

跳转到指定楼层
desehawk 发表于 2014-10-9 18:29:20
Apache是一个开源组织
Cloudera公司把Apache hadoop开源项目商业化,开发出了Cloudera Manager及CDH等一套相关的hadoop生态系统
详细参考:
了解Hadoop--Hadoop最全生态系统介绍

新手指导:hadoop官网介绍及如何下载hadoop(2.4)各个版本与查看hadoop API介绍


上面都是Apache的hadoop相关的开源项目




这里有一篇帖子讲的很详细
大数据架构师基础:hadoop家族,Cloudera产品系列等各种技术








CDH版本衍化
hadoop是一个开源项目,所以很多公司在这个基础进行商业化,Cloudera对hadoop做了相应的改变。
Cloudera公司的发行版,我们将该版本称为CDH(Cloudera Distribution Hadoop)。截至目前为止,CDH共有5个版本,其中,前两个已经不再更新,最近的两个,分别是CDH4在Apache Hadoop 2.0.0版本基础上演化而来的),CDH5,它们每隔一段时间便会更新一次


这里是相关代码:
Cloudera 上百项目及Cloudera hadoop生态系统源码下载区


回复

使用道具 举报

InSight 发表于 2014-10-9 20:55:15
回复

使用道具 举报

bioger_hit 发表于 2014-10-9 21:06:52
InSight 发表于 2014-10-9 20:55
唉,不问不知道,一问吓一跳。现在才知道自己的知识有多匮乏了。

原来CDH是Cloudera公司 ...


Hortonworks Hadoop区别于其他的Hadoop发行版(如Cloudera)的根本就在于,Hortonworks的产品均是百分之百开源。
Cloudera有免费版和企业版,企业版只有试用期。
apache hadoop则是原生的hadoop。

目前在中国流行的是apache hadoop,Cloudera CDH,当然Hortonworks也有用的

Apache Ambari是一个基于web的工具,用于配置、管理和监视Apache Hadoop集群,支持Hadoop HDFS,、Hadoop MapReduce、Hive、HCatalog,、HBase、ZooKeeper、Oozie、Pig和Sqoop。Ambari同样还提供了集群状况仪表盘,比如heatmaps和查看MapReduce、Pig、Hive应用程序的能力,以友好的用户界面对它们的性能特性进行诊断。




回复

使用道具 举报

InSight 发表于 2014-10-9 21:13:42
bioger_hit 发表于 2014-10-9 21:06
Hortonworks Hadoop区别于其他的Hadoop发行版(如Cloudera)的根本就在于,Hortonworks的产品均是百分之 ...



Cloudera的CDH基于原生Apache Hadoop的开发后有很大改变吗?
开发后的优势体现在哪里?

如果要是知道的话,麻烦告知一下。感谢!

回复

使用道具 举报

bioger_hit 发表于 2014-10-9 21:27:09
本帖最后由 bioger_hit 于 2014-10-9 21:33 编辑
InSight 发表于 2014-10-9 21:13
Cloudera的CDH基于原生Apache Hadoop的开发后有很大改变吗?
开发后的优势体现在哪里?

Cloudera CDH、CM
简化了hadoop的部署,对于hadoop监控及hadoop生态系统监控都是非常方便的。
cdh安装,只需要一键安装即可,参考
各个版本Linux单节点伪分布一键安装CDH5.1.X及提交wordcount到yarn高可靠文档



如果想安装hadoop生态系统,并且能够监控起来,Cloudera Manager安装是一个不错的选择
参考:
Cloudera Manager5及CDH5在线(cloudera-manager-installer.bin)安装详细文档






如果是apache hadoop的安装则相对复杂些,在加上监控,难度就加大了。参考
hadoop2.2完全分布式最新高可靠安装文档对于三个组件的安装参考

hadoop2.2+hbase0.96+hive0.12安装整合详细高可靠文档及经验总结
从上面看出,整合方面就比较复杂些,所以cdh简化了不少部署



虽然CDH、CM(Cloudera Manager)简化了部署,但是hadoop原生也有自己的好处,版本更新快,不受限制,各有优点和缺点




回复

使用道具 举报

howtodown 发表于 2014-10-9 21:37:35
CDH入门可以参考这个:
Cloudera Manager、CDH零基础入门、线路指导

回复

使用道具 举报

InSight 发表于 2014-10-9 21:44:19
回复

使用道具 举报

InSight 发表于 2014-10-9 21:47:29
回复

使用道具 举报

maizhu 发表于 2014-10-19 23:29:26
写的不错,学习了
回复

使用道具 举报

12下一页
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条