使用正则表达式使grep和sed中的匹配操作在awk中也适用。
- 选择时忽略大小写
[root@VM_89_124_centos awk]# awk '/[vV]eg/ {print $0}' test.txt
Carrots veg 1.39 1 n
Onions Veg .89 6 n
Celery Veg 1.79 1 n
如果没有指定模式(目标),awk认为数据库中的所有记录都是匹配项,并且对所有记录(行)运行awk语句中的指定动作。
通过上节的学习我们也知道以下写法也是对的,不指定动作 即 awk的默认动作是使用print命令输出符合标准要求的全部记录。
[root@VM_89_124_centos awk]# awk '/[vV]/ {print}' test.txt
Carrots veg 1.39 1 n
Onions Veg .89 6 n
Celery Veg 1.79 1 n
[root@VM_89_124_centos awk]# awk '/[vV]/' test.txt
Carrots veg 1.39 1 n
Onions Veg .89 6 n
Celery Veg 1.79 1 n
- 指定行的开始
[root@VM_89_124_centos awk]# awk '/^C/ {print $2,$1}' test.txt
veg Carrots
Dairy Cheese
Meat Chichen
Veg Celery
再试一个比较复杂点的例子:
[root@VM_89_124_centos awk]# cat test.txt
Carrots veg 1.39 1 n
Milk Dairy 1.89 2 n
Magazine Sundry 3.50 2 n
Cheese Dairy 4.39 1 n
Sandwich Deli 3.89 2 y
Onions Veg .89 6 n
Chichen Meat 4.89 2 n
Newspaper Sundry 1.00 1 y
Fish Meat 3.79 3 n
Floorwax Hshld 4.65 1 y
Melon Fruit 1.98 3 n
Celery Veg 1.79 1 n
Napkins Hshld 1.49 6 y
[root@VM_89_124_centos awk]# awk '/^[^A-O]/ {print}' test.txt
Sandwich Deli 3.89 2 y
解释一下:选择所有非 A-O之间字母 开始 的行,然后输出整行。
- 使用正则表达式明确定义搜索条件。
可以为awk提供更加具体准确的匹配项。输入:
[root@VM_89_124_centos awk]# awk -F: '/^[a-m][a-z]*:/ {print $1,$7}' /etc/passwd
bin /sbin/nologin
daemon /sbin/nologin
adm /sbin/nologin
lp /sbin/nologin
halt /sbin/halt
mail /sbin/nologin
games /sbin/nologin
ftp /sbin/nologin
dbus /sbin/nologin
avahi /sbin/nologin
libstoragemgmt /sbin/nologin
abrt /sbin/nologin
chrony /sbin/nologin
mysql /bin/bash
bruce /bin/bash
解释一下:以冒号为定界符,匹配以a-m开头,其后跟了一个或多个a-z的字母,在这之后又跟了一个冒号(:)的行。然后打印出第一列和第七列。
awk中正则表达式最强大的功能在于匹配行或字段