分享 ClickHouse 连表update
hyj 2021-7-8 14:10
CREATE TABLE table2_join Engine = Join(ANY, INNER, id) INSERT INTO table2_join SELECT * from table2 ALTER TABLE table1 UPDATE name= joinGet('table2_join', 'name', id)
1864 次阅读|0 个评论
分享 Flink 读取hbase 慢该如何解决
nettman 2021-7-5 22:56
Flink 读取hbase 由于hbase只有32分区(buckload之后自动分区)所以flink有32个算子读取数据 读取数据比较慢 实际上只有两个数据节点在计算(有四个计算节点 30 * 4 slots) 有什么方案可以加快读取hbase数据 可以打印些日志,看每个slot消费的是谁的分区
1099 次阅读|0 个评论
分享 About云VIP面试提升课程介绍
admin 2021-6-8 14:41
本课程包含面试和提升,包括面试考点、面试指导等方面的内容,全面系统的帮助我们面试和提升。 很多同学在培训技术后,仍然找不到工作,是因为整体、综合能力没有得到提升。 本套课程目标是打造一个职场人全面素质的提升,比如技术能力、沟通能力、表达能力、思维能力、学习能力等方面的提升。这些能力的提升不止是 ...
865 次阅读|0 个评论
分享 jvm hs_err_pid.log 文件分析工具 CrashAnalysis 使用教程
阿飞 2021-5-13 15:10
jvm hs_err_pid.log 文件分析工具 CrashAnalysis 使用教程
在上一篇《jvm crash(崩溃)文件 hs_err_pid.log 分析教程》中,我们可以看到 jvm crash 后生成的 hs_err_pid.log 文件非常的复杂,非常的难懂!那么有没有一款工具能帮助我们来分析它呢?且看本文给你推荐的这款工具 CrashAnalysis 的用法。 CrashAnalysis 简介 CrashAnalysis 是一款诊断工具。是某APM项目组成 ...
2689 次阅读|0 个评论
分享 Clickhouse bug DB::Exception: PeekableReadBuffer: Memory limit exceed
pig2 2021-3-30 17:13
Caused by: java.lang.Throwable: Code: 241, e.displayText() = DB::Exception: PeekableReadBuffer: Memory limit exceed (version 20.11.4.13 (official build)) 这是clickhouse的一个bug 地址:https://github.com/ClickHouse/ClickHouse/commit/6325b15a63335e2efd7de1ae92d2907493a07a9c 修复版本:v21. ...
1189 次阅读|0 个评论
分享 面试必备Hive stage划分
hyj 2021-3-25 07:31
面试必备Hive stage划分
Hive stage划分见下图: 更多细节可参考 https://blog.csdn.net/weixin_43878293/article/details/102648655 https://blog.csdn.net/jiayuanv_127/article/details/50936964
1462 次阅读|0 个评论
分享 CDH修改startdate,可以一直免费使用
nettman 2021-3-18 19:51
CDH修改startdate,可以一直免费使用
CDH的使用日期,可以通过CM_VERSION表来进行修改
931 次阅读|0 个评论
分享 请问ES查询时,一定要把数据保存到ES存储中吗?
何裕涛 2021-2-18 11:16
请教大家一个具体问题: 在使用ES查询时,一定要把数据保存到ES存储中吗? 还是说可以保存在外部,如Oracle DB, MongoDB中。
1039 次阅读|2 个评论 热度 1
分享 Azkaban安装
hyj 2021-2-2 09:52
Azkaban安装
Azkaban安装 1 Azkaban介绍 Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组工作和流程。Azkaban定义了一种kv文件格式来建立任务之间的关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。它有如下功能特点: Web用户界面 方便上传工作流 方便设 ...
772 次阅读|0 个评论
分享 解决开发中由于group by造成数据倾斜解决办法
hyj 2021-1-19 18:42
解决开发中由于group by造成数据倾斜解决办法
如果设置hive.map.aggr为true,hive.groupby.skewindata为true,执行流程如下: 会生成两个job来执行group by,第一个job中,各个map是平均读取分片的,在map阶段对这个分片中的数据根据group by 的key进行局部聚合操作,这里就相当于Combiner操作。 在第一次的job中,map输出的结果随机分区,这样就可以平均分 ...
1433 次阅读|0 个评论
关闭

推荐上一条 /2 下一条