Linux查找和筛选工具

本文为原创文章，转载请标明出处

文件名通配符
- 单字符匹配元字符 ?
- 多字符匹配元字符 *
- 字符范围匹配符 []
- 排除范围匹配符 [!]
命令中的正则表达式
- 单字符匹配符 .
- 单字符或字符串重复匹配符 *
- 行首匹配符 ^
- 行尾匹配符 $
- 反斜杠屏蔽符 \
- 范围匹配符 [] 和排除范围匹配符 [^]
- 词首词尾匹配符 \< \>
- 重复次数匹配符 x\{\}
查找文件工具 find
- 按文件名查找
- 按文件权限查找
- 按文件类型查找
- 按文件时间戳记查找
- 按文件大小查找
- 按文件属主或属组查找
- 使用 exec 或 ok 处理查找到的文件
- 使用 xargs 处理查找到的文件
查找文本工具 grep
转换和删除重复命令 tr
合并和分割工具
- 排序 sort
- 数据剪切 cut
- 数据粘贴 paste
- 数据连接 join
- 去除重复 uniq
- 分割文件 split

1. 文件名通配符

单字符匹配元字符 ?

匹配任意一个字符

多字符匹配元字符 *

匹配0或1或多个字符

字符范围匹配符 []

匹配一个字符范围，其表现形式可以是“-”表示的字母和数字的范围，也可以是几个字符的组合

排除范围匹配符 [!]

不匹配符号内出现的字符组合或字符数字范围

2. 命令中的正则表达式

单字符匹配符 .

匹配任意一个字符

单字符或字符串重复匹配符 *

匹配单个字符或一个字符串序列的一次或多次重复出现

行首匹配符 ^

在匹配中指示行首位置字符串或模式

行尾匹配符 $

在匹配中指示行尾位置字符串或模式

反斜杠屏蔽符 \

屏蔽一些特殊字符的特殊含义

范围匹配符 [] 和排除范围匹配符 [^]

与文件名通配符中的范围匹配符和排除范围匹配符用法基本相同

词首词尾匹配符 \< \>

在文本开头或文本结尾匹配与单词开头或单词结尾相匹配的特定的字符串或模式

重复次数匹配符 x\{\}

可以精确匹配字符或字符串连续出现的次数或次数范围

3. 查找文件工具 find

基本格式

# find [path] [expression]

参数：

depth：先从当前目录查找，然后再从当前目录的子目录中查找
maxdepth LEVELS：向下搜索到第LEVELS层目录，LEVELS为0表示只在当前目录查找
mindepth LEVELS：至少向下搜索LEVELS层目录
mount：不搜索远程文件系统
follow：搜索如果遇到链接文件就连同链接所指向的文件一并查找

name：按文件名查找
iname：按文件名查找，不区分大小写
perm：按文件权限查找
tye：按文件类型查找
mtime +n[-n]：按文件内容改变的时间查找，+n表示修改时间距现在n天前，-n表示修改时间距现在n天以内
ctime +n[-n]：按文件属性改变的时间查找
atime +n[-n]：按文件访问的时间查找
size +n[-n]：按文件大小查找，+n表示文件大小大于n，-n表示文件大小小于n，n表示块，1块等于512字节
user：按文件所属主查找
group：按文件所属组查找
nouser：查找没有有效属主的文件
nogroup：查找没有有效属组的文件

prune：不再指定目录中查找
print：将查找的文件输出到标准输出
exec：对查找到的文件执行shell命令
ok：对查找到的文件执行shell命令，在每次执行前提示用户是否执行

按文件名查找

如：

# find /etc -name "*.conf"

按文件权限查找

如：

# find /etc -perm 664

按文件类型查找

如：

# find /dev -type b

按文件时间戳记查找

如：

# find /var/log -mtime -1

按文件大小查找

如：

# find /var/log -size +1M

按文件属主或属组查找

如：

# find / -user root

使用 `exec` 或 `ok` 处理查找到的文件

如：

# find /var/log -size +1M -exec ls -l {} \;

使用 `xargs` 处理查找到的文件

如：

# find ~/ -name "test.txt" | xargs rm

4. 查找文本工具 grep

grep：global regular expression print 全局正则表达式打印

# grep [option] [pattern] [file]

参数

i：忽略大小写
n：将结果输出的同时，也输出该行行号
s：在没有查找到匹配的内容时，不显示错误信息
l：从多个文件中查找时，只输出找到匹配内容的文件名称
h：从多个文件中查找时，只输出匹配的内容，不显示文件名称
c：只输出匹配内容的总行数
v：反转查找，即输出匹配内容以外的行

例如：

查询来自云南和河南的学生信息
# grep -E 'Yunnan|Henan' students

5. 转换和删除重复命令 tr

# tr [option] [string1] [string2]

参数

c：使用string1中字符的补集替换
d：删除string1中包含的所有字符
s：删除重复字符

例如：

小写转大写
# tr -s "a-z" "A-Z" <test
删除所有重复字母
# tr -s "[a-z][A-Z]"

6. 合并和分割工具

排序 sort

# sort [option] [file]

参数

b：按字段进行分类并忽略前面的空格或制表符
d：按字典的顺序进行排序，将除空格和字母以外的字符排除
f：忽略大小写
g：根据数值进行排序
i：只考虑可打印的字符
M：将字符按月份进行比较，例如JAN<...<DEC
n：按数值进行比较排序
r：返向排序
c；测试文件内容是否已经进行了排序，若无任何返回信息，则表示已经执行了排序操作
k：指定排序的关键字
m：合并已经排序的文件，不进行排序
o：将结果写入文件，不再输出到标准输出上
s：通过屏蔽最后的分类比较稳定排序
t：使用指定的字符作为字段分隔符
T：将临时文件放入指定的目录内
u：如果与参数c一起使用，则检查是否在排序时已经去除重复的行，没有参数c时，则在排序时去掉重复行
z：用一个0字节作为结束，而不是一个换行符

例如：

对students文件第5个字段第8个字符按数字从大到小排序
# sort -k5.8nr students
先对students文件第5个字段排序，再按第10个字段排序
# sort -k 5,10n students
指定“#”作为字段分隔符，并对students文件第三个字段进行排序
# sort -t# -k3 students
合并students1，students2到students_new
# sort -m students1 students2 >students_new

数据剪切 cut

cut [option] [file]

参数

b：表示要操作的对象是字节
c：表示要操作的对象是字符
f：表示要操作的对象是字段
d：指定字段分隔符，默认情况下是制表符tab
s：表示不包括没有字段分隔符的行

N：表示第N个字节
N-：表示从N到一行结束的内的所有文本
N-M：表示从N到M之间的所有文本
-M：表示从开始到M之间的所有文本
-：从开始到结束的所有文本

例如：

剪切students文件所有行的前10个字符
# cut -b-10 students
以“#”为分隔符，并对students文件第1，2，4个字段进行剪切
# cut -d# -f1-2,4 students

数据粘贴 paste

paste [option] [file...]

参数

d：对新生成的文本指定新的字段分隔符，默认情况下是制表符tab
s：横向粘贴，默认纵向粘贴

例如：

纵向粘贴paste1，paste2文件
# paste paste1 paste2

数据连接 join

# join [option] file1 file2

参数

a：用于输出2个文件中有关联和没关联的行，将有关联的行执行连接后输出，没关联的行按预定的格式输出
e：在文件1和文件2中查找关联字段，如果没有关联字段，则将无关联字段的行相应的字段用参数指定的字符串替代
i：在连接过程中忽略大小写
j：使用指定的字段作为关键字段连接
o：格式化输出
t：设置字段间的分隔符，默认为空格或制表符tab
v：与参数a的作用相同，但参数v只输出无关联的行

例如：

指定使用文件1的第2个字段和文件2的第2个字段作为关键字，只显示文件1的第1、2、6字段和文件2的第3字段
# join -j1 2 -j2 2 -o "1.1,1.2,1.6,2.3" students1 students2

去除重复 uniq

#uniq [option] [input[option]]

参数

c：输出重复行的重复次数
d：仅输出重复的行
f：忽略一些字段，只比较指定字段
s：忽略一些字符，只比较指定字段
i：忽略大小写
u：输出不重复的行
w；指定要比较的字符位置

sort -u 与 uniq 区别
sort -u 将整个文本重复行删除只保留一行
uniq 删除连续重复行只保留一行
例如：

忽略第1个字段，从第2个字段第2个字符处开始比较
# uniq -f1 -s3 char

分割文件 split

# split [option] [input file] [output file]

参数

l：按行对文件进行分割
b：按字节对文件进行分割
C：按字符对文件进行分割
d：使用数字作为输出文件的后缀

例如：

指定每3行划分为一个文件
# split -l 3 students students

如有不当之处，请予指正，谢谢～

最后编辑于：2017.12.10 23:07:29

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,547评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,399评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,428评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,599评论 1赞 274
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,612评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,577评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,941评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,603评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,852评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,605评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,693评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,375评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,955评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,936评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,172评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,970评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,414评论 2赞 342