流编辑器
流可以想象为流水,源源不断。而流编辑,则表示在流动过程中动态地进行编辑。这种编辑方式意味着不用等到一切加载结束才进行处理,来之安之,关注当下。类似的如流媒体处理方式,使得用户可以边下边播,看点算点。
流编辑器命令
LINUX 下有很多工具命令,一旦用过便会喜欢上。这些命令特别简洁,但这种简洁也意味着初次相见时的可读性差,由此认真地熟悉下用法非常有必要。一旦熟悉了,就掌握了一把利器,需要时可是看得见的效率。
命令 sed
就是这样一个工具。sed
是 Stream Editor
的简写,它一次处理一行内容,提供丰富的操作指令,指令可以在命令行直接给出,也可以写成脚本文件。总的来说,活生生一编程语言,我们需要的就是熟悉它的表达方式。只要学会利用它能处理一两种常见的应用场景,之后的具体问题具体分析着使用即可。
在 LINUX 操作系统中,或者 Windows 下运行的 Git Bash 中都可以使用该命令。
常见小应用场景
你需要做的就是对你想要的效果进行描述,然后使用 sed
的语法来表述。
有如下文件(test.txt):
123,345,adfkladfk,432,234
1234567
5432344
1233456
adfa,2134 3456,890
nonumber
a123456678b
场景1:只保留数字串,一行内有多串的使用逗号隔开
sed 's/[^0-9]\+/,/g' test.txt
输出结果:
123,345,432,234
1234567
5432344
1233456
,2134,3456,890
,
,123456678,
表述:将每行非数字的连续串替换为逗号。
sed 本身是按行处理,我们只需要告诉它使用替换
指令,要替换的内容使用正则表达式为[^0-9]+
,替换为,
这些要素即可。
替换
指令 -> s
正则表达式[^0-9]+
-> [^0-9]\+
说明:在 sed
的命令参数中正则表达式中的+
、(
、)
等符号需要转义
使用选项字符g
表示行内所有非数字串都要替换,否则只会替换一处。
根据 sed
的替换指令规则:sed '替换指令/正则表达式/替换为/选项' 文件名
,即得到完整命令:sed 's/[^0-9]\+/,/g' test.txt
场景2:将数字串逐行呈现以便复制到EXCEL中
sed 's/\([^0-9]\+\)/\r\n/g' test.txt | sed '/^$/d'
123
345
432
234
1234567
5432344
1233456
2134
3456
890
123456678
表述:将非数字串替换成换行,然后把空行删除。
表述的前一部分跟场景1类似,表达为 sed 's/\([^0-9]\+\)/\r\n/g' test.txt
后边删除空行,则是遵循/正则表达式/删除指令
的语法。^$
表示首尾在一起,即空行,d
为删除指令。表达为:sed '/^$/d'
整个表达式实际是由两个步骤组成,前一个步骤的输出作为后一个步骤的输入。
实现相同的效果有多种方式,就像有多种表述它的方式一样。
有过实际体会之后,也许有些问题这个工具是可以为你解决的,关键是你需要的时候还能够想起它。