分享

Apache Flink Table Store 0.2.0 发布!

问题导读:
1、什么是 Flink Table Store?
2、新版本有哪些显着特点?
3、Append Only是什么?
4、下一步有什么改进?




Apache Flink 社区很高兴地宣布发布 Apache Flink table store(0.2.0)。

请查看完整文档以获取详细信息和用户指南。

什么是 Flink Table Store

Flink Table Store 是一个数据湖存储,用于实时流式更新/删除变更日志摄取和高性能查询。

2022-09-07_182025.jpg

Flink Table Store 作为一种新型的可更新数据湖,具有以下特点:

  •     大吞吐量数据摄取,同时提供良好的查询性能。
  •     具有主键过滤器的高性能查询,最快 100 毫秒。
  •     Lake Storage 上提供流式读取,Lake Storage 也可以与 Kafka 集成,提供秒级流式读取。


显着特点

在此版本中,我们完成了许多令人兴奋的功能。

目录

此版本引入了表格存储自己的目录,并支持自动同步到 Hive Metastore。

  1. CREATE CATALOG tablestore WITH (
  2.   'type'='table-store',
  3.   'warehouse'='hdfs://nn:8020/warehouse/path',
  4.   -- optional hive metastore
  5.   'metastore'='hive',
  6.   'uri'='thrift://<hive-metastore-host-name>:<port>'
  7. );
  8. USE CATALOG tablestore;
  9. CREATE TABLE my_table ...
复制代码


生态系统

在这个版本中,我们提供了对 Flink 1.14 的支持,并为多个计算引擎提供了读取支持。

2022-09-07_182057.jpg

Append Only

append-only 表特性是一种性能改进,只接受 INSERT_ONLY 数据追加到存储中,而不是对现有数据进行更新或去重,因此适用于不需要更新的用例(例如日志数据同步)。
  1. CREATE TABLE my_table (
  2.     ...
  3. ) WITH (
  4.     'write-mode' = 'append-only',
  5.     ...
  6. )
复制代码

流式写入 Append-only 表也具有异步压缩功能,因此您不必担心小文件。

重新缩放存储桶

由于总桶数对性能有很大影响,表格存储允许用户通过ALTER TABLE命令调整桶数并重新组织必要的分区,旧分区保持不变。

入门

有关详细信息,请参阅入门指南。

下一步是什么?

在即将发布的 0.3.0 版本中,您可以期待以下附加功能:

  •     Streaming Changelog Concurrent Writes,分离Compaction。
  •     聚合表,用于构建您的物化视图。
  •     为部分更新/聚合表生成变更日志。
  •     Full Schema Evolution 支持删除列和重命名列。
  •     Flink Dim Join 的查找支持。

请尝试发布,在 Flink 邮件列表中分享您的反馈并为项目做出贡献!

我们鼓励您下载该版本并通过Flink 邮件列表 或JIRA与社区分享您的反馈。

贡献者名单

Apache Flink 社区要感谢使这个版本成为可能的每一位贡献者:

Jane Chan、Jia Liu、Jingsong Lee、liliwei、Nicholas Jiang、openinx、tsreaper


作者:flink.apache.org
来源:https://mp.weixin.qq.com/s/cyYaom7O927tUVyb4T6vAg

最新经典文章,欢迎关注公众号


没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条