分享

你们公司宽表用起来感觉怎么样,遇到什么问题吗?


说一下数仓宽表的优缺点吧?

你们公司宽表用起来感觉怎么样,遇到什么问题吗?

你们为什么要设计成宽表呢?

一  什么是宽表
宽表,通常是指业务主题相关的指标、维度、属性关联在一起的一张数据库表。
在数据仓库建设中,组织相关和相似数据,采用明细宽表,复用关联计算,减少数据扫描,提高明细数据表的易用性
在汇总数据层,加群指标的维度退化,采取更多的宽表化手段构建公共指标数据层,提升公共指标的复用性,减少重复加工。

二 优点

提高查询性能
快速响应
方便使用,降低使用成本
提高用户满意度

三 缺点
由于把不同的内容都放在同一张表存储,宽表已经不符合三范式的模型设计规范,随之带来的主要坏处就是数据的大量冗余
另外就是灵活性差,就比如说线上业务表结构变更,宽表模式改造量也比较大
开发宽表为了避免宽表重复迭代,我们应该去了解业务全流程,得需要知道需扩展哪些维度,沉淀哪些指标,这样就流程会比较长,特别是有些业务快速迭代的话,就有点捉襟见肘


已有(2)人评论

跳转到指定楼层
阿飞 发表于 2021-1-7 16:37:23
何裕涛 发表于 2021-1-7 15:51
宽表要注意使用的场合:
1. 一般在数据加工汇总的最后一个步骤使用,这样的话,就不会成为数据加工的瓶颈 ...

对的,周期性生成宽表,这个会提高效率
回复

使用道具 举报

何裕涛 发表于 2021-1-7 15:51:30
宽表要注意使用的场合:
1. 一般在数据加工汇总的最后一个步骤使用,这样的话,就不会成为数据加工的瓶颈;
2. 把高频的查询统计操作,做成批处理定时任务,周期性生成宽表,可以大大提供系统的性能。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /5 下一条