about云开发

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 3285|回复: 1

[小知识点] linux下在压缩的文件中找乱码

[复制链接]

6

主题

6

听众

0

收听

高级会员

Rank: 4

积分
2522

最佳新人热心会员

发表于 2016-4-13 16:18:53 | 显示全部楼层 |阅读模式
因数据核查需要,在一堆压缩文件中(共8269个压缩文件,200G的存储空间)找是否有乱码;在网上搜索了好的办法,结合自己实践,找到办法,先共享下,
环境: linux、zh_CN.utf8
一、先解压后搜索
1、将同一上层的adb文件的压缩文件解压到当前文件夹():ls  ../adb/* |xargs-n1 tar -xzvf
2、搜索: grep -P "[\x80-\xff]" *.txt |head -10
二、直接在压缩文件中查找
find  ../adb/ -name "*.gz" -exec zgrep -a -P  "[\x80-\xff]" {} \;
特别说明: 必须带a,否则提示“匹配到二进制文件 (标准输入)”
以上只是本人本次的找到办法,肯定不是最优办法哟,望有能优化的共享共享。

81

主题

30

听众

29

收听

高级会员

Rank: 4

积分
2336

最佳新人活跃会员热心会员

发表于 2016-4-13 16:43:35 | 显示全部楼层
欢迎加入about云群425860289432264021 ,云计算爱好者群,关注about云腾讯认证空间
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

推荐上一条 /2 下一条

QQ|小黑屋|about云开发-学问论坛|社区 ( 京ICP备12023829号

GMT+8, 2018-11-17 02:19 , Processed in 0.348166 second(s), 29 queries , Gzip On.

Powered by Discuz! X3.2 Licensed

快速回复 返回顶部 返回列表