分享

flume个性化处理json数据

zeus_lhl 发表于 2016-10-27 15:00:13 [显示全部楼层] 回帖奖励 阅读模式 关闭右栏 6 31009
flume source 段json字符串,现在想把它转换成普通的字符串,存储到hdfs或者hive中,怎么做呢?我用的flume,但不太会,现在拿到hdfs上,也是json格式。我想在存入hdfs前,把这个json串进行一个个性化处理,然后按照格式化后的数据格式,存储到hive或者hdfs中。
具体怎么做

已有(6)人评论

跳转到指定楼层
einhep 发表于 2016-10-27 15:25:15
方法两个:
1.二次开发flume
2.在源头过滤下,也就是没有传递的时候,把json转换成正常字符串。或则在hdfs上通过mapreduce处理下。
回复

使用道具 举报

zeus_lhl 发表于 2016-10-27 15:28:55
einhep 发表于 2016-10-27 15:25
方法两个:
1.二次开发flume
2.在源头过滤下,也就是没有传递的时候,把json转换成正常字符串。或则在hdf ...

怎么二次开发
回复

使用道具 举报

langke93 发表于 2016-10-27 15:32:06



下面是一些资料:
Flume1.3开发者指南【英文版about云提供】
http://www.aboutyun.com/forum.php?mod=viewthread&tid=15335


【Flume】flume文件监控的source组件开发,增量传输文件内容,支持断点续传功能

http://www.aboutyun.com/forum.php?mod=viewthread&tid=13757


flume 插件开发介绍

http://www.aboutyun.com/forum.php?mod=viewthread&tid=8315


更多官网
http://flume.apache.org/FlumeDeveloperGuide.html
回复

使用道具 举报

zeus_lhl 发表于 2016-10-27 18:22:40
langke93 发表于 2016-10-27 15:32
下面是一些资料:
Flume1.3开发者指南【英文版about云提供】
http://www.aboutyun.com/forum.php?m ...

这个所谓的二次开发和开发interceptors有什么区别吗
回复

使用道具 举报

w517424787 发表于 2016-10-28 22:49:02
二次开发还是麻烦了,咋不在flume之前就把json格式数据转换成你想要的格式,这样还方便点!
回复

使用道具 举报

目前_还活着 发表于 2016-11-2 17:19:15
直接在sink 里面把json 转成你想要的格式再sink
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条