分享

新人求助开发

fzu3144 2015-7-13 14:27:52 发表于 疑问解答 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 1 8699
----案例----
flume采集
tomcat运行日志:
1.哪个时间段出现错误为“严重”最多
2.出现异常类型数量的排行

tomcat日志格式大概如下,有多个文件,内容大致像一下,异常类型包括:“信息/警告/严重等等” 如何编程对某个文件夹下的所有日志进行解析开发?
三月 10, 2015 10:13:53 上午 org.apache.catalina.core.AprLifecycleListener init
信息: The APR based Apache Tomcat Native library which allows optimal performance in production environments was not found on the java.library.path: /usr/java/packages/lib/amd64:/usr/lib64:/lib64:/lib:/usr/lib
三月 10, 2015 10:13:53 上午 org.apache.coyote.http11.Http11Protocol init
信息: Initializing Coyote HTTP/1.1 on http-8095
三月 10, 2015 10:13:53 上午 org.apache.catalina.startup.Catalina load
信息: Initialization processed in 868 ms
三月 10, 2015 10:13:53 上午 org.apache.catalina.core.StandardService start
信息: Starting service Catalina
三月 10, 2015 10:13:53 上午 org.apache.catalina.core.StandardEngine start
信息: Starting Servlet Engine: Apache Tomcat/6.0.37

已有(1)人评论

跳转到指定楼层
Alkaloid0515 发表于 2015-7-13 14:55:37
数据量有多大。
不大的自己随便写个Java程序即可。
数据量比较大,用flume传递到hdfs,然后使用mapreduce清洗即可。

1.哪个时间段出现错误为“严重”最多
2.出现异常类型数量的排行

像这两个mapreduce完成能干得了。

参考
【转】【mapreduce进阶编程五】全局排序
http://www.aboutyun.com/thread-9359-1-1.html



MapReduce初级案例(2):使用MapReduce数据排序
http://www.aboutyun.com/thread-7046-1-1.html
(出处: about云开发)



回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条