hyj 发表于 2020-7-15 09:29 好的,好久没登陆了。 |
本帖最后由 hyj 于 2020-7-15 09:31 编辑 wajika 发表于 2020-7-15 08:18 ![]() 环境自己搭建。 这两个文件就是实现的统计。 flow_statistic_mapper.py 主要从各个cdn日志中筛选出有效的格式化数据,因此最多的操作就是对日志文件名和日志每一行进行正则匹配。 下面就是格式化日志的函数,也就是对流量的过滤 ![]() flow_statistic_reducer.py 根据ip查询是国内流量还是海外流量,对每场直播进行统计。 reduce里面详细看看,分别判断了国内和国外ip,然后输出统计结果 ![]() |
hyj 发表于 2020-7-1 09:34 看过代码并没有提供 |
wajika 发表于 2020-7-1 08:30 更多详细内容可以看看代码 |
怎么没有讲方法? 怎么统计流量 怎么利用日志计算? |