分享

Cloudera6 Beta详解:更快的分析,改进搜索和更高的可扩展性

问题导读

1.cloudera6哪些组件效率更高?
2.哪些组件成为完全的完全native 组件?
3.文中单个Cloudera Manager 6处理几千个节点?
4.什么是SDX?
5.Cloudera Enterprise 6.0主要包含哪些组件?




获取最新文章,学习资源,可以关注公众号


我们看到官网已经发布cloudera6 beta,到目前尚未提供安装包。

1.png

地址:
https://www.cloudera.com/downloads/manager/5-6-0.html

1.png

地址:
https://www.cloudera.com/downloads/cdh/5-15-0.html

对于cloudera6官网做了说明:

更快的分析,改进搜索和更高的可扩展性

效率更高
使业务能够更快地获得结果。这可以提高数据科学家和业务分析师的工作效率,并优化资源利用率以加速分析 - 具有以下增强功能:

  • 机器学习有助于将指定作业分配到最佳硬件资源,例如使用GPU进行深度学习,预计可将速度提高10倍
  • Apache Hive 2.0矢量化为分析工作负载带来高达80%的性能提升
  • 标准化API和调试可提高开发人员的工作效率
  • Apache HBase 2.0通过隔离多租户应用程序,带来性能和稳定性增强,并使实时运营分析更加强大、可靠
  • Apache Oozie 5.0提供了再现 job的schedule能力,从而简化了分析应用程序的操作过程



创新
通过我们的集成分布式带来强大,稳定版本的开源工具,构建统一的多学科分析应用程序比以往任何时候都更容易:

  • Solr 7.0通过嵌套数据类型和JSON方面支持增强了集成搜索功能,为企业提供了另一种方式发现和理解所有的非结构化数据
  • Kafka 1.0和Spark 2.2成为该平台的完全native 组件,这使得流数据管道更易于管理和更强大



质量
Cloudera的企业客户相信,只有一个完整的平台可以提供的质量控制和安全性。

  • 通过集成和审查的软件stack的成熟质量和功能,使用案例成功分析关键任务
  • 客户可以轻松管理极端规模集群,在单个Cloudera Manager 6 interface中处理多达2500个节点。
  • 默认启用wire加密安全性



SDX
处理复杂的数据驱动的问题需要分析工作协调一致,而不是筒仓。Cloudera共享数据体验(SDX)将企业级集中式安全、治理和管理能力与共享数据目录相结合,消除了昂贵的数据筒仓、锁定到专有格式、以及分析用户的资源争用。现在数据科学家,数据工程师。其他人可以享受SDX在Office中的协作优势,作为任何基于云的应用程序的自我管理框架,以及Cloudera Altux中的托管服务。


Cloudera Enterprise 6.0主要组件

SDX

分析与机器学习工作负载
CORE 平台
Cloudera Manager 6.0
Cloudera Director 6.0
Cloudera Navigator 6.0
Apache Sentry 2.0
Apache Kafka 1.0
Apache Solr 7.0
Apache Spark 2.2

Apache Hadoop 3.0
Apache Hive 2.1
Apache HBase 2.0
Apache Oozie 5.0
Apache Avro 1.8
Apache Parquet 1.9




本帖被以下淘专辑推荐:

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条