搜索
搜 索
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
›
日志
发布
日志
上传
相册
添加
分享
记录
日志
好友的日志
我的日志
随便看看
发表新日志
最新发表的日志
|
推荐阅读的日志
|
Nutch
|
Docker
|
K8s
|
Flink
|
Hyperledgar
|
比特币
|
以太坊
|
机器学习
|
图像处理
|
NLP
|
神经网络
|
其它
|
ElasticSearch
|
大数据
|
Spark
|
Sqoop
|
Lucene
|
Solr
|
Nosql
|
Oozie
|
Cloudera系列
|
ZooKeeper
|
Flume
|
Hadoop
|
Kafka
|
Hive
|
Hbase
|
Mapreduce
|
Storm
|
人工智能
|
区块链
|
openstack
|
物联网
|
容器
分享
ClickHouse 连表update
hyj
2021-7-8 14:10
CREATE TABLE table2_join Engine = Join(ANY, INNER, id) INSERT INTO table2_join SELECT * from table2 ALTER TABLE table1 UPDATE name= joinGet('table2_join', 'name', id)
1867 次阅读
|
0
个评论
分享
Flink 读取hbase 慢该如何解决
nettman
2021-7-5 22:56
Flink 读取hbase 由于hbase只有32分区(buckload之后自动分区)所以flink有32个算子读取数据 读取数据比较慢 实际上只有两个数据节点在计算(有四个计算节点 30 * 4 slots) 有什么方案可以加快读取hbase数据 可以打印些日志,看每个slot消费的是谁的分区
1099 次阅读
|
0
个评论
分享
About云VIP面试提升课程介绍
admin
2021-6-8 14:41
本课程包含面试和提升,包括面试考点、面试指导等方面的内容,全面系统的帮助我们面试和提升。 很多同学在培训技术后,仍然找不到工作,是因为整体、综合能力没有得到提升。 本套课程目标是打造一个职场人全面素质的提升,比如技术能力、沟通能力、表达能力、思维能力、学习能力等方面的提升。这些能力的提升不止是 ...
865 次阅读
|
0
个评论
分享
jvm hs_err_pid.log 文件分析工具 CrashAnalysis 使用教程
阿飞
2021-5-13 15:10
在上一篇《jvm crash(崩溃)文件 hs_err_pid.log 分析教程》中,我们可以看到 jvm crash 后生成的 hs_err_pid.log 文件非常的复杂,非常的难懂!那么有没有一款工具能帮助我们来分析它呢?且看本文给你推荐的这款工具 CrashAnalysis 的用法。 CrashAnalysis 简介 CrashAnalysis 是一款诊断工具。是某APM项目组成 ...
2700 次阅读
|
0
个评论
分享
Clickhouse bug DB::Exception: PeekableReadBuffer: Memory limit exceed
pig2
2021-3-30 17:13
Caused by: java.lang.Throwable: Code: 241, e.displayText() = DB::Exception: PeekableReadBuffer: Memory limit exceed (version 20.11.4.13 (official build)) 这是clickhouse的一个bug 地址:https://github.com/ClickHouse/ClickHouse/commit/6325b15a63335e2efd7de1ae92d2907493a07a9c 修复版本:v21. ...
1189 次阅读
|
0
个评论
分享
面试必备Hive stage划分
hyj
2021-3-25 07:31
Hive stage划分见下图: 更多细节可参考 https://blog.csdn.net/weixin_43878293/article/details/102648655 https://blog.csdn.net/jiayuanv_127/article/details/50936964
1466 次阅读
|
0
个评论
分享
CDH修改startdate,可以一直免费使用
nettman
2021-3-18 19:51
CDH的使用日期,可以通过CM_VERSION表来进行修改
932 次阅读
|
0
个评论
分享
请问ES查询时,一定要把数据保存到ES存储中吗?
何裕涛
2021-2-18 11:16
请教大家一个具体问题: 在使用ES查询时,一定要把数据保存到ES存储中吗? 还是说可以保存在外部,如Oracle DB, MongoDB中。
1040 次阅读
|
2
个评论
热度
1
分享
Azkaban安装
hyj
2021-2-2 09:52
Azkaban安装 1 Azkaban介绍 Azkaban是由Linkedin开源的一个批量工作流任务调度器。用于在一个工作流内以一个特定的顺序运行一组工作和流程。Azkaban定义了一种kv文件格式来建立任务之间的关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。它有如下功能特点: Web用户界面 方便上传工作流 方便设 ...
772 次阅读
|
0
个评论
分享
解决开发中由于group by造成数据倾斜解决办法
hyj
2021-1-19 18:42
如果设置hive.map.aggr为true,hive.groupby.skewindata为true,执行流程如下: 会生成两个job来执行group by,第一个job中,各个map是平均读取分片的,在map阶段对这个分片中的数据根据group by 的key进行局部聚合操作,这里就相当于Combiner操作。 在第一次的job中,map输出的结果随机分区,这样就可以平均分 ...
1433 次阅读
|
0
个评论
1
2
3
4
5
6
7
8
9
10
... 206
/ 206 页
下一页
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈