图文精华

hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...

About云-梭伦科技 › 日志

日志

最新发表的日志| 推荐阅读的日志 | Nutch | Docker | K8s | Flink | Hyperledgar | 比特币 | 以太坊 | 机器学习 | 图像处理 | NLP | 神经网络 | 其它 | ElasticSearch | 大数据 | Spark | Sqoop | Lucene | Solr | Nosql | Oozie | Cloudera系列 | ZooKeeper | Flume | Hadoop | Kafka | Hive | Hbase | Mapreduce | Storm | 人工智能 | 区块链 | openstack | 物联网 | 容器

分享 ClickHouse 连表update: hyj 2021-7-8 14:10; CREATE TABLE table2_join Engine = Join(ANY, INNER, id) INSERT INTO table2_join SELECT * from table2 ALTER TABLE table1 UPDATE name= joinGet('table2_join', 'name', id); 1864 次阅读|0 个评论

分享 Flink 读取hbase 慢该如何解决: nettman 2021-7-5 22:56; Flink 读取hbase 由于hbase只有32分区（buckload之后自动分区）所以flink有32个算子读取数据读取数据比较慢实际上只有两个数据节点在计算（有四个计算节点 30 * 4 slots）有什么方案可以加快读取hbase数据可以打印些日志，看每个slot消费的是谁的分区; 1099 次阅读|0 个评论

分享 About云VIP面试提升课程介绍: admin 2021-6-8 14:41; 本课程包含面试和提升，包括面试考点、面试指导等方面的内容，全面系统的帮助我们面试和提升。很多同学在培训技术后，仍然找不到工作，是因为整体、综合能力没有得到提升。本套课程目标是打造一个职场人全面素质的提升，比如技术能力、沟通能力、表达能力、思维能力、学习能力等方面的提升。这些能力的提升不止是 ...; 865 次阅读|0 个评论

分享 jvm hs_err_pid.log 文件分析工具 CrashAnalysis 使用教程: 阿飞 2021-5-13 15:10; 在上一篇《jvm crash(崩溃)文件 hs_err_pid.log 分析教程》中，我们可以看到 jvm crash 后生成的 hs_err_pid.log 文件非常的复杂，非常的难懂！那么有没有一款工具能帮助我们来分析它呢？且看本文给你推荐的这款工具 CrashAnalysis 的用法。 CrashAnalysis 简介 CrashAnalysis 是一款诊断工具。是某APM项目组成 ...; 2689 次阅读|0 个评论

分享 Clickhouse bug DB::Exception: PeekableReadBuffer: Memory limit exceed: pig2 2021-3-30 17:13; Caused by: java.lang.Throwable: Code: 241, e.displayText() = DB::Exception: PeekableReadBuffer: Memory limit exceed (version 20.11.4.13 (official build)) 这是clickhouse的一个bug 地址：https://github.com/ClickHouse/ClickHouse/commit/6325b15a63335e2efd7de1ae92d2907493a07a9c 修复版本：v21. ...; 1189 次阅读|0 个评论

分享面试必备Hive stage划分: hyj 2021-3-25 07:31; Hive stage划分见下图：更多细节可参考 https://blog.csdn.net/weixin_43878293/article/details/102648655 https://blog.csdn.net/jiayuanv_127/article/details/50936964; 1462 次阅读|0 个评论

分享 CDH修改startdate，可以一直免费使用: nettman 2021-3-18 19:51; CDH的使用日期,可以通过CM_VERSION表来进行修改; 931 次阅读|0 个评论

分享请问ES查询时，一定要把数据保存到ES存储中吗？: 何裕涛 2021-2-18 11:16; 请教大家一个具体问题：在使用ES查询时，一定要把数据保存到ES存储中吗？还是说可以保存在外部，如Oracle DB, MongoDB中。; 1039 次阅读|2 个评论热度 1

分享 Azkaban安装: hyj 2021-2-2 09:52; Azkaban安装 1 Azkaban介绍 Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组工作和流程。Azkaban定义了一种kv文件格式来建立任务之间的关系，并提供一个易于使用的web用户界面维护和跟踪你的工作流。它有如下功能特点： Web用户界面方便上传工作流方便设 ...; 772 次阅读|0 个评论

分享解决开发中由于group by造成数据倾斜解决办法: hyj 2021-1-19 18:42; 如果设置hive.map.aggr为true,hive.groupby.skewindata为true，执行流程如下：会生成两个job来执行group by，第一个job中，各个map是平均读取分片的，在map阶段对这个分片中的数据根据group by 的key进行局部聚合操作，这里就相当于Combiner操作。在第一次的job中，map输出的结果随机分区，这样就可以平均分 ...; 1433 次阅读|0 个评论

123 4 5 6 7 8 9 10 ... 206 / 206 页下一页

推荐 /2

关于我们· 联系我们· 加入我们· 小黑屋· 合作伙伴

Copyright © 2001-2024 About云-梭伦科技 Powered by Discuz! X3.4 Licensed Discuz Team.

简书 / 京ICP备2020039040号简书网举报电话：021-34700000

意见
反馈