用户组:游客
问题导读 1.Hadoop3.3支持JDK哪个版本? 2.SCM是什么? 3.YARN应用程序做了哪些改进? 4.整合腾讯云实现了什么文件系统? ...
问题导读: 1. B站数仓的现状和痛点是什么? 2. 针对典型的四个案例,对应的优化方案和收益是什么? 3. 介绍在批流融合方面, ...
问题导读: 1、新版本性能提升的如何? 2、有哪些多样的分析场景? 3、多租户资源隔离如何实现的? 4、极致弹性与存算分离有 ...
问题导读: 1、Iceberg 核心特性有哪些? 2、如何设计Flink+ Iceberg 构建近实时数仓? 3、如何进行实时集成入湖? 4、Hive ...
在当今人工智能驱动的世界中,企业不断寻求有效的方法来将生成的大量客户数据货币化。 该领域中两个经常讨论的解决 ...
问题导读: 1、如何解决不同引擎 SQL 语义的一致性? 2、Hudi Catalog 如何保证数据的一致性? 3、如何避免 Compact ...
问题导读: 1、“客户档案” 场景如何理解? 2、在Kudu和Hudi里代码实现的差异有哪些? 3、“实时数仓”场景如何理解? 4、 ...
问题导读: 1、怎样配置清理策略? 2、怎样指定 Clustering 计划? 3、怎样进行文件聚合? Hudi测试:批处理 ...
问题导读 1.Hudi 文件格式可以是哪些? 2.Hudi如何实现非常快速的增量更改? 3.Hudi核心特性有哪些? Apache Hudi 是 ...
问题导读 1.Hudi提供哪些功能? 2.Hudi默认显示表中的快照数据,是否正确? 3.Hudi 是否允许通过时间点查询旧版本数据? ...
问题导读: 1、Deltastreamer 终止策略是什么? 2、在Spark对接方面有哪些优化? 3、Flink对接方面有哪些优化? 4、迁移指南 ...
问题导读: 1、CDC数据实时如何写入MSK? 2、OLAP引擎如何查询Hudi表? 3、如何将Flink CDC发送数据到Kafka? 4、Flink Stre ...
本帖最后由 levycui 于 2022-7-13 19:21 编辑 问题导读: 1、对数据湖的需求有哪些? 2、Apache Hudi是什么? 3、键生成器 ...
问题导读 1.SparkSQL模式演进需要设置哪个参数? 2.如何添加列? 3.如何修改列? Schema Evolution(模式演进)允许用 ...
问题导读 1.Hudi目前支持哪三种索引? 2.Hudi 事务内核设计哪三个支柱? 3.Hudi时间线用来做什么的? 在我们之前的 ...
问题导读 1.本文的背景是什么? 2.全量分区表如何拉链化? 3.优化的技术方案发挥了哪些作用? 01 背景 2020年以来, ...
问题导读: 1、TIS可以为您做什么? 2、TIS实现原理如何理解? 3、如何创建MySQL到Hudi千表入湖通道? 4、如何设置Flink增量 ...
问题导读: 1、规范标准阶段数仓有哪些特性? 2、如何理解开放自由阶段数据湖? 3、融合共享阶段湖仓一体有哪些优势? 4、为 ...
问题导读: 1、现有架构有哪些改进? 2、新架构收益都有哪些? 3、Debezium 增量Binlog同步如何配置? 4、Hudi同步Metastore ...
问题导读: 1.工作中使用过Iceberg吗? 2.在使用Iceberg遇到那些难题? 3.常用的Iceberg优化机制有哪两种? 在上周介绍Ice ...
问题导读: 1.Apache Hudi和Debezium构建CDC入湖管道在什么背景下产生的? 2.在使用 Debezium 源连接器进行 CDC 摄取时,Hudi ...
问题导读: 1、写期间VS写入后小文件如何优化? 2、核心配置有哪些? 3、Spark+Hudi如何优化? 4、如何进行GC调优? ...
问题导读: 1、数据湖和生态系统如何理解? 2、大批量摄取的限制有哪些? 3、可缩放的初始引导程序是什么? 4、管理 Postgre ...
问题导读:1.之前了解数据湖吗?2.用过那些数据湖相关技术?3.本文中的内容是否有所借鉴? 本文是字节跳动数据平台开发套件团队 ...
问题导读:1.有了解过Apache Hudi吗?2.Apache Hudi有哪些重要特征?3.谈谈你对Apache Hudi的了解? 在发布的Apache Hu ...
问题导读: 1、数据湖是炒作概念还是未来趋势? 2、不同企业的典型应用有哪些? 3、如何开展实时金融数据湖应用? 4、数据湖 ...
问题导读: 1.你对Apache Hudi熟悉吗? 2. Hudi表分为哪几种类型? 3.Hudi 表由 哪两大项构成? 一篇关于字节跳动基于 A ...
问题导读: 1、常见的 CDC 分析方案有哪些? 2、为何选择 Flink + Iceberg? 3、如何实时写入读取? 一、常见的 CD ...
问题导读: 1.现实中有哪些案例属于近实时的范畴? 2.增量模型需要解决那些核心问题? 3.一张hudi数据湖表具有那些形态? 一 ...
问题导读: 1、什么是数据湖? 2、数据湖的基本特征有哪些? 3、基本架构如何理解? 4、数据湖与数据仓库的区别是什么? ...
问题导读: 1.模型建设需要哪些工作? 2.熟悉ETL平台吗? 3.你熟悉的非关系数据库有哪些? 好久不写数据中台了,但是我发现大 ...
本版积分规则 发表帖子
查看 »