用户组:游客
本帖最后由 levycui 于 2020-12-22 20:26 编辑 问题导读: 1、Maxwell与Canal相比,具有哪些特点? 2、Maxwell如何配置? 3 ...
问题导读: 1、如何分析沉默用户、本周回流用户数、流失用户? 2、如何分析最近连续3周活跃用户? 3、如何分析最近七天内连续 ...
问题导读: 1、如何设计每日新增设备明细表? 2、如何使用每日新增设备表? 3、如何设计用户留存主题表? 4、如何设计留存用 ...
本帖最后由 levycui 于 2020-12-15 19:31 编辑 问题导读: 1、如何检查缺失数据? 2、如何缺失数据的计算? 3、如何填充缺 ...
问题导读: 1、如何设计当日(dau)、当周、当月活动的每个设备明细表? 2、如何根据日用户访问明细,获得周用户访问明细? 3、 ...
问题导读: 1、业务术语有哪些? 2、如何使用collect_set函数和日期处理函数(datediff)? 3、如何使用date_add函数和next_d ...
问题导读: 1、如何设计DWD层启动表数据解析? 2、如何设计DWD层事件表数据解析? 3、如何设计DWD层事件表获取? 4、如何设 ...
问题导读: 1、为什么要进行数据分层? 2、数仓搭建环境需要哪些准备工作? 3、如何设计数仓ODS层? 4、Shell中单引号和双引 ...
问题导读: 1、数据仓库的输入数据源和输出系统分别是什么? 2、HDFS存入大量小文件,有什么影响? 3、Kafka消息数据积压,Ka ...
问题导读: 1、如何对Kafka进行压力测试? 2、FileChannel和MemoryChannel区别? 3、如何采集通道启动/停止脚本? 上一篇 ...
问题导读: 1、如何使用Flink导入数据? 2、如何使用Spark导入数据? 3、如何从MySQL中导入数据? 4、如何从Hive中导入数据 ...
本帖最后由 levycui 于 2020-11-18 00:10 编辑 问题导读: 1、什么是指标体系? 2、为什么搭建指标体系? 3、如何搭建指标 ...
问题导读: 1、如何监控Hadoop集群? 2、如何进行系统负载管理? 3、如何确保Hadoop集群可靠安全? 上一篇:数据仓库建设 ...
问题导读: 1、硬件应该如何部署? 2、硬件清单都包含什么? 3、系统架构是如何设计的? 上一篇:数据仓库建设方案详细( ...
问题导读: 1、怎样搭建大数据基础平台? 2、大数据基础平台要具有哪些功能? 3、大数据基础平台有哪些优势? 上一篇:数 ...
问题导读: 1、如何保证复杂实体关系下的数据准确性? 2、如何降低多数据源情况下的数据处理复杂度? 3、如何提升实时多流Joi ...
本帖最后由 levycui 于 2020-11-10 21:54 编辑 问题导读: 1、技术选型方面主要考虑哪些方面? 2、广告场景应用有哪些要点? ...
问题导读: 1、常用的算法模型有哪些? 2、如何对数据进行监控管理? 3、大数据平台的数据服务是怎样的? 上一篇:数据仓 ...
问题导读: 1、数据仓库的总体架构是怎样的? 2、如何进行数据采集? 3、数据是如何进行加工和处理的? 1.1 数据仓库总 ...
问题导读 1.什么是数据倾斜? 2.开发人员需要注意哪些? 3.怎样优化join? 前言 实际搞过离线数据处理的同学都 ...
问题导读: 1、对数据湖有哪些预期? 2、数据湖架构如何设计? 3、如何做好数据治理工作? 4、如何保障数据湖的安全? ...
问题导读: 1、数据分析系统可解决哪些痛点? 2、如何进行目标设计? 3、实时计算如何设计? 4、实时存储有哪些考虑点? ...
问题导读 1.怎样优化亿级数据表的查询? 2.怎样优化复杂的SQL查询? 3.怎样优化使用函数的复杂SQL的查询? HiveSQ ...
本帖最后由 levycui 于 2020-9-22 19:49 编辑 问题导读: 1、如何设计设备主题? 2、如何设计会员主题(会员主题+漏斗分析) ...
问题导读 1.DWS 层有哪些专业术语? 2.系统函数有哪些? 3.nvl 函数基本语法是什么? 4.DWS 层(业务)包含哪些内容? ...
问题导读 1.Flink 1.11 有哪些新功能? 2.如何使用 flink-cdc-connectors 捕获 MySQL 和 Postgres 的数据变更? 3.怎样利 ...
问题导读: 1. 拉链表是什么? 2. 为什么要做拉链表? 3. 拉链表的制作过程是怎么样的? 上一篇:企业级数据仓库构建 ...
本帖最后由 levycui 于 2020-9-16 19:48 编辑 问题导读: 1、如何设计用户行为启动表数据解析? 2、get_json_object 函数如 ...
本帖最后由 levycui 于 2020-9-15 19:16 编辑 问题导读: 1、为什么要进行数据仓库分层? 2、需要掌握哪些数仓理论知识? 3 ...
问题导读: 1. 电商业务的流程是怎么样的? 2. 电商业务库表结构如何设计? 3. 电商表的同步策略是怎么样的? 上一篇 ...
本版积分规则 发表帖子
查看 »