搜索
搜 索
本版
文章
帖子
用户
图文精华
hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布 ...
首页
Portal
专题
BBS
面试
办公|编程助手
更多
登录
注册
用户组:游客
主题
帖子
云币
我的帖子
我的收藏
我的好友
我的勋章
设置
退出
导读
淘贴
博客
群组
社区VIP
APP下载
今日排行
本周排行
本周热帖
本月排行
本月热帖
会员排行
About云-梭伦科技
»
专题
›
1分钟小知识
›
小知识分享区
›
Flink
›
心得体会
›
flink实时写hive 产生的小文件一般怎么处理啊?
0
1
0
分享
flink实时写hive 产生的小文件一般怎么处理啊?
nettman
2021-7-5 22:54:27
发表于
心得体会
[显示全部楼层]
阅读模式
关闭右栏
1
3674
About云VIP帮助找工作和提升
可以试试这几个方法:
1.性能满足的情况下,尽量设置'sink.shuffle-by-partition.enable'=true
2.如果设置了'sink.shuffle-by-partition.enable'=false,建议使用Flink 1.12版本的自动合并小文件功能。
3.设置合理的checkpoint周期,业务允许的情况下,可以加大checkpoint周期,减少生成文件的数量。
4.可以最大限度降低Flink产生小文件的情况,但是无法完全避免,根据实际情况定期合并小文件。
加微信w3aboutyun,可拉入技术爱好者群
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
显身卡
已有(1)人评论
电梯直达
正序浏览
若无梦何远方
发表于 2021-7-6 15:57:11
有更细点的资料吗 官网的链接直接 copy 过来也行 (锦上添花)
回复
使用道具
举报
显身卡
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
发表新帖
nettman
超级版主
关注
2858
主题
3151
帖子
477
粉丝
TA的主题
高德地图大模型开发年薪百万,落地大模型自学灯态规律变化
2024-5-22
电商大模型该如何实现和设计
2024-5-21
小模型开发者是开发端侧大模型吗
2024-5-21
云侧与端侧、通用与垂直行业之间的关系。
2024-5-21
国内大模型最新统计列表
2024-5-20
24小时热文
架构师的自我修养-史海峰V3.0公共版
数据库系统工程师教程(第4版)
人情世故速查速用大全集
腾讯内推,一句话错失50万OFFER
少子化催生高就业,日本大学生进入反选时代
关闭
推荐
/2
中文版ChatGPT
1.无需魔法 2.提高编程效率 3.提高文档能力
查看 »
新手帮助
新手帮助:注册遇到问题,领取资源,加入铁粉群,不会使用搜索,如何获取积分等
查看 »
意见
反馈