用户组:游客
本帖最后由 pig2 于 2014-4-11 23:20 编辑 hive或许我们有一个整体的认识,可以转换为mapreduce,那么具体是如何做的那? 1. ...
1.hive内联支持什么格式? 2.分号字符注意什么问题? 3.hive中empty是否为null? 4.hive是否支持插入现有表或则分区中? 5.hi ...
本帖最后由 pig2 于 2014-4-11 23:21 编辑 hive同样也面对传统数据库的一些操作,那么hive 1.如何增加分区、删除分区? 2.如 ...
本帖最后由 pig2 于 2014-4-11 23:23 编辑 hive增删改查与传统数据的区别是什么? hive不支持用insert语句一条一条的进 ...
1.入口 /bin/cli.sh 调用CliDriver类进行初始化过程 Ø 处理 -e, -f,-h等信息,如果是-h,打印提示信息 ...
问题导读: 1、数据仓库的总体架构是怎样的? 2、如何进行数据采集? 3、数据是如何进行加工和处理的? 1.1 数据仓库总 ...
本帖最后由 pig2 于 2014-4-11 23:24 编辑 1.基本的Select 操作如何实现? 2.基于Partition的查询如何实现? 3.如何实现join ...
问题导读 1.GROUPING SETS与另外哪种方式等价? 2.根据GROUP BY的维度的所有组合进行聚合由哪个关键字完成? 3.ROLLUP与RO ...
问题导读 1.什么是拉链表? 2.拉链表如何更新? 3.拉链表制作包含哪些过程? 上一篇 大数据项目之电商数仓(总结) ...
问题导读 1.DWS 层有哪些专业术语? 2.系统函数有哪些? 3.nvl 函数基本语法是什么? 4.DWS 层(业务)包含哪些内容? ...
问题导读 1.数据仓库的输入数据源和输出系统分别是什么? 2.Flume 采集数据会丢失吗? 3.Kafka 消息数据积压,Kafka 消费能 ...
问题导读: 1、硬件应该如何部署? 2、硬件清单都包含什么? 3、系统架构是如何设计的? 上一篇:数据仓库建设方案详细( ...
问题导读: 1、如何监控Hadoop集群? 2、如何进行系统负载管理? 3、如何确保Hadoop集群可靠安全? 上一篇:数据仓库建设 ...
问题导读 1.LAG功能是什么? 2.LEAD与LAG功能有什么相似的地方那个? 3.FIRST_VALUE与LAST_VALUE分别完成什么功能? ...
问题导读: 1.NTILE作用是什么? 2.按照pv降序排列,生成分组内每天的pv名次可使用哪个窗口函数? 3.RANK 和 DENSE_RANK作用 ...
问题导读: 1. 拉链表是什么? 2. 为什么要做拉链表? 3. 拉链表的制作过程是怎么样的? 上一篇:企业级数据仓库构建 ...
问题导读 1.Sqoop导入导出Null存储一致性该如何解决? 2. Sqoop底层运行的任务是什么? 3.Sqoop数据导出的时候一次执行多 ...
本帖最后由 levycui 于 2020-9-16 19:48 编辑 问题导读: 1、如何设计用户行为启动表数据解析? 2、get_json_object 函数如 ...
问题导读: 1、如何设计每日新增设备明细表? 2、如何使用每日新增设备表? 3、如何设计用户留存主题表? 4、如何设计留存用 ...
问题导读: 1、数据仓库的输入数据源和输出系统分别是什么? 2、HDFS存入大量小文件,有什么影响? 3、Kafka消息数据积压,Ka ...
问题导读: 1、如何设计当日(dau)、当周、当月活动的每个设备明细表? 2、如何根据日用户访问明细,获得周用户访问明细? 3、 ...
问题导读: 1、业务术语有哪些? 2、如何使用collect_set函数和日期处理函数(datediff)? 3、如何使用date_add函数和next_d ...
问题导读: 1、如何设计DWD层启动表数据解析? 2、如何设计DWD层事件表数据解析? 3、如何设计DWD层事件表获取? 4、如何设 ...
问题导读: 1、为什么要进行数据分层? 2、数仓搭建环境需要哪些准备工作? 3、如何设计数仓ODS层? 4、Shell中单引号和双引 ...
问题导读: 1、如何对Kafka进行压力测试? 2、FileChannel和MemoryChannel区别? 3、如何采集通道启动/停止脚本? 上一篇 ...
问题导读: 1、怎样搭建大数据基础平台? 2、大数据基础平台要具有哪些功能? 3、大数据基础平台有哪些优势? 上一篇:数 ...
本帖最后由 levycui 于 2020-9-22 19:49 编辑 问题导读: 1、如何设计设备主题? 2、如何设计会员主题(会员主题+漏斗分析) ...
问题导读: 1. 数仓数据采集模块集群规划是怎么样的? 2. 数仓日志生成模块的配置是怎么样的? 3. 数仓数据采集模块Kafka如 ...
本帖最后由 levycui 于 2020-9-9 22:59 编辑 问题导读: 1、如何进行埋点数据处理? 2、事件日志数据如何设计表? 3、如何 ...
本帖最后由 levycui 于 2020-9-9 22:41 编辑 问题导读: 1、数据仓库的架构是什么样的? 2、如何进行技术选型? 3、系统数 ...
本版积分规则 发表帖子
查看 »