sed
3.1 认识sed
sed 是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(patternspace ),接着用sed 命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。然后读入下行,执行下一个循环。如果没有使诸如‘D’ 的特殊命令,那会在两个循环之间清空模式空间,但不会清空保留空间。这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出或-i。
功能:主要用来自动编辑一个或多个文件, 简化对文件的反复操作
3.2 使用sed
3.2.1 命令格式
sed
[options]
'[地址定界] command'
file``(s)
3.2.2 常用选项options
- -n:不输出模式空间内容到屏幕,即不自动打印,只打印匹配到的行
- -e:多点编辑,对每行处理时,可以有多个Script
- -f:把Script写到文件当中,在执行sed时-f 指定文件路径,如果是多个Script,换行写
- -r:支持扩展的正则表达式
- -i:直接将处理的结果写入文件
- -i.bak:在将处理的结果写入文件之前备份一份
3.2.3 地址定界
- 不给地址:对全文进行处理
- 单地址:
- #: 指定的行
- /pattern/:被此处模式所能够匹配到的每一行
- 地址范围:
- #,#
- #,+#
- /pat1/,/pat2/
- #,/pat1/
-
~:步进
- sed -n '1~2p' 只打印奇数行 (1~2 从第1行,一次加2行)
- sed -n '2~2p' 只打印偶数行
3.2.4 编辑命令command
- d:删除模式空间匹配的行,并立即启用下一轮循环
- p:打印当前模式空间内容,追加到默认输出之后
- a:在指定行后面追加文本,支持使用\n实现多行追加
- i:在行前面插入文本,支持使用\n实现多行追加
- c:替换行为单行或多行文本,支持使用\n实现多行追加
- w:保存模式匹配的行至指定文件
- r:读取指定文件的文本至模式空间中匹配到的行后
- =:为模式空间中的行打印行号
- !:模式空间中匹配行取反处理
-
s///:查找替换,支持使用其它分隔符,如:s@@@,s###;
- 加g表示行内全局替换;
- 在替换时,可以加一下命令,实现大小写转换
- \l:把下个字符转换成小写。
- \L:把replacement字母转换成小写,直到\U或\E出现。
- \u:把下个字符转换成大写。
- \U:把replacement字母转换成大写,直到\L或\E出现。
- \E:停止以\L或\U开始的大小写转换
3.3 sed用法演示
3.3.1 常用选项options演示
qinwj 14:42:14 R290-1: /mnt/X500/farmers/qinwj
$ cat demo
aaa
bbbb
AABBCCDD
- p:打印当前模式空间内容,追加到默认输出之后:匹配到的行会打印一遍,不匹配的行也会打印
$ sed /aa/p demo
aaa
aaa
bbbb
AABBCCDD
- -n 不显示没有匹配到的行
$ sed -n /aa/p demo
aaa
- -e 类似于多匹配; sed -e "s/a/A/ demo 表示将demo 文件里面的a,变成A, 且只替换遇到的第一个
$ sed -e "s/a/A/" -e "s/b/B/" demo
Aaa
Bbbb
AABBCCDD
- -f 使用文件来处理
$ cat sedscirpts
s/A/a/g
$ sed -f sedscirpts demo
aaa
bbbb
aaBBCCDD
- -i 直接对文件进行处理
$ sed -i.bak "s/A/a/g" demo
$ cat demo
aaa
bbbb
aaBBCCDD
并且会自动生成改动前的.bak
的备份文件
$ cat demo.bak
aaa
bbbb
AABBCCDD
3.3.2 地址界定演示
$ cat demo
aaa
bbbb
AABBCCDD
aaaAAAbbbBBBcc
- 将第二行的b全部替换成B
$ sed "2s/b/B/g" demo
aaa
BBBB
AABBCCDD
aaaAAAbbbBBBcc
- 只打印匹配
aaa
模式的行
$ sed -n "/aaa/p" demo
aaa
aaaAAAbbbBBBcc
- 只打印前两行
$ sed -n "1,2p" demo
aaa
bbbb
- 打印第2行到匹配
DD
行的
$ sed -n "2,/DD/p" demo
bbbb
AABBCCDD
- 将字段里面的所有A或者a都替换成E
$ sed "1~2s/[aA]/E/g" demo
EEE
bbbb
EEBBCCDD
aaaAAAbbbBBBcc
3.3.3 编辑命令command演示
$ cat demo
aaa
bbbb
AABBCCDD
aaaAAAbbbBBBcc
-
d
表示删除模式空间匹配的行
$ sed "2d" demo # 删除第二行
aaa
AABBCCDD
aaaAAAbbbBBBcc
-
p
打印当前模式空间内容,追加到默认输出之后, -n:不输出模式空间内容到屏幕,即不自动打印,只打印匹配到的行
$ sed -n "2p" demo
bbbb
- a:在指定行后面追加文本,支持使用\n实现多行追加
$ sed "2a123" demo
aaa
bbbb
123
AABBCCDD
aaaAAAbbbBBBcc
- i:在行前面插入文本,支持使用\n实现多行追加
$ sed "1i123" demo
123
aaa
bbbb
AABBCCDD
aaaAAAbbbBBBcc
- c:替换行为单行或多行文本,支持使用\n实现多行追加
$ sed "3c123\n456" demo #将第三行的内容替换成123\n456
aaa
bbbb
123
456
aaaAAAbbbBBBcc
- =:为模式空间中的行打印行号
$ sed -n "=" demo
1
2
3
4
- !:模式空间中匹配行取反处理
$ sed -n '2!p' demo #打印除了第2行的内容
aaa
AABBCCDD
aaaAAAbbbBBBcc
将文本内容中的大写都转换成小写
$ sed "s/[a-z]/\u&/g" demo
AAA
BBBB
AABBCCDD
AAAAAABBBBBBCC
这行命令同等于:
$ sed 's@[a-z]@\u&@g' demo
AAA
BBBB
AABBCCDD
AAAAAABBBBBBCC
3.4 sed高级编辑命令
(1)格式
- h:把模式空间中的内容覆盖至保持空间中
- H:把模式空间中的内容追加至保持空间中
- g:从保持空间取出数据覆盖至模式空间
- G:从保持空间取出内容追加至模式空间
- x:把模式空间中的内容与保持空间中的内容进行互换
- n:读取匹配到的行的下一行覆盖 至模式空间
- N:读取匹配到的行的下一行追加 至模式空间
- d:删除模式空间中的行
- D:删除 当前模式空间开端至\n 的内容(不再传 至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed
(2)一个案例+示意图演示
① 案例:倒序输出文本内容
$ cat num.txt
One
Two
Three
$ sed '1!G;h;$!d' num.txt
Three
Two
One
② 总结模式空间与保持空间关系:
保持空间是模式空间一个临时存放数据的缓冲区,协助模式空间进行数据处理