求助 flume 日志堆积问题

查看数: 26746 | 评论数: 18 | 收藏 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2015-9-9 18:25

正文摘要:

在大量日志情况下 flume收集日志跟不上处理日志的速度 就会造成日志堆积 C:\Users\hadoop\Desktop 需求: 我这里是有一个工具 会每10秒检测这个/home/gag/log 目录下 有没有新的日志文件产生 有就将日志移动到/hom ...

回复

tntzbzc 发表于 2015-9-9 20:39:49
请叫我野区养猪 发表于 2015-9-9 20:25
数据产生的频率非常高   现在日志量非常庞大 导致flume的处理完全跟不上  造成了日志堆积  
这个flume是 ...




多配置几个chennel也行

1.png

楼主的模式应该类似这种把
jixianqiuxue 发表于 2015-9-15 09:58:44
参考下kafka

由于采集数据的速度和数据处理的速度不一定同步,因此添加一个消息中间件来作为缓冲,选用apache的kafka


用这个框架
大数据架构:flume-ng+Kafka+Storm+HDFS 实时系统组合
http://www.aboutyun.com/thread-6855-1-1.html



zxmit 发表于 2015-9-10 22:17:15
请叫我野区养猪 发表于 2015-9-10 16:45
目前是 需要解决  flume碰到死循环日志 造成的日志堆积 所以不会出现小文件  
现在上面提出来的 要解决  ...

死循环日志?! 感觉很不科学,程序里面既然会出现死循环的情况,日志级别定义为DEBUG应该比较合理
zxmit 发表于 2015-9-10 22:10:35
请叫我野区养猪 发表于 2015-9-10 10:36
sink 设置为空?
Discards all events it receives from the channel. Required properties are in bold ...

设置为空只是为了确定是否是因为网络瓶颈导致数据堆积
请叫我野区养猪 发表于 2015-9-10 16:45:59
muyannian 发表于 2015-9-10 15:19
10秒移动,是否会产生大量小文件。
为何如此的频繁。

目前是 需要解决  flume碰到死循环日志 造成的日志堆积 所以不会出现小文件  
现在上面提出来的 要解决 如果日志在死循环的情况下 flume堆积大量的日志
所以现在做了一个死循环日志  不停的输出日志  但是flume的工作能力是有限的 它发送的速度没有收集的快
muyannian 发表于 2015-9-10 15:19:07
10秒移动,是否会产生大量小文件。
为何如此的频繁。

请叫我野区养猪 发表于 2015-9-10 12:01:32
@pig 求助~
请叫我野区养猪 发表于 2015-9-10 12:00:20
求助各位版主 !!!
请叫我野区养猪 发表于 2015-9-10 10:36:29
zxmit 发表于 2015-9-9 19:22
分析一下:看你的配置文件,flume作为一个数据采集器,将采集到的数据发送出去。
首先,数据产生的速率是 ...

sink 设置为空?
Discards all events it receives from the channel. Required properties are in bold 这是官网给的解释 丢弃所有的事件,从信道接收。所需属性是以黑体。属性名为默认的描述通道类型的组件类型名称,需要为空
但是翻译之后 还是不怎么懂 并且 设置为null 代表什么含义?
a_zhen 发表于 2015-9-10 09:22:06
都讨论讨论啊
关闭

推荐上一条 /2 下一条