- 正则表达式 --用于文本精确匹配
(1).: 代表任意单个字符,除了换行符
(2)*: 前导字符出现 0 次 或 多次
(3).*: 任意长度的字符
(4)^: 行的开头
(5)$: 行的结尾
(6)^$: 空行
(7)[abc] 以字符为单位的或关系
(8)[a-z] [A-Z] [0-9]
(9)[^abc] 取非
(10)^[abc] a或b或c开头的行
(11)^[^abc] 非a或非b或非c开头
(12)\<: 取单词的头
(13)\>: 取单词的尾
正则表达式是一种描述方法,一种小型的语言,用字符来表示某种含义的符号
一个点代表一个字符
例1 样式.T.代表3个字符,中间的字符是T 左右两边是任意一个字符
例2 ... 代表字符长度是3的字符串,如果要对比 请加入转意符
例3 data... 代表data.后接3个字符,入data.txtt data.cf data.123
^在行首
例如 样式^jack 代表jack应出现在行首,才符合条件 如jack ding
表示尾部
例 样式123$ 表示在最后一个行是123才符合条件 如jack123
123jack
以下是常见用法
[A-Z] 匹配一个大写的字母
[a-z]匹配一个小写的字母
[0-9]一个数字
[^A-Z]除了大写字母之外的一个字符
[^a-zA-Z] 一个非英文字母的字符
[^a-zA-Z0-9] 一个非英文字母,并且非数字的字符
^出现在括号里的第一个位置 表示"非/不是"的意思
*出现0个以上
*表示前面的字符出现0个或者多个
例 aA*c 代表A这个字符可能出现0个或者0个以上 如:ac aAc aAAc
{...}指定符合的个数
指定符合的个数
指定前面字符的个数
例如:{3,5}表示前面的字符有3到5个。[a-z]{3,5}、代表以小字母组成的字符串,长度是3到5
(..)把比对符合的字符串暂时保存起来
例如:H(..)y表示要保存H和y之间的3个字符
若要提取保存的字符串,可以用位置参数。1代表第一个保存的字符串,2代表第二个保存的字符
支持正则表达式工具
- grep/egrep find locate sed awk vim
grep 'regex' file --把正则表达式写在单引号中,防止shell解释正则表达式
grep -E 'regex' file --匹配扩展的正则表达式在grep中需要加-E选项
egrep=grep -E
# find / -regex '.*\.iso$'
# find / -regex '^\/var.*\.iso$'
locate -r
# locate -r '^\/var.*\.iso$'
sed -n '/^root/p' /etc/passwd
awk '/^root/ {print $0}' /etc/passwd
vim
/^root
/nologin$
:%s/^root/ROOT/g
- grep
o:只打印匹配出来的字符
n:显示行号
v:取反
l:匹配成功,打印文件
c:统计匹配到的字符的数量,但是统计的是行数,而不是匹配的字符个数
A:匹配行后几行
B:匹配行前几行
C:匹配行前后几行, 如 -C 2 与 -2
i:忽略大小写
q:静默执行,一般在测试时,取返回值用
r/R:对一个目录下的所有文件进行搜索
--color:用特殊颜色标示匹配到的关键字
H: 列出匹配到关键字的文件路径
egrep:拓展正则搜索
egrep = grep -E
# cat grep.txt
ggle
gogle
google
gooogle
gagle
gaagle
gaaagle
abcgef
abcdef
操作如下:
grep 'g.g' grep.txt --只要两个g字母中间有一个任意字符就可以
grep 'g*g' grep.txt --只要有一个g字母就可以。等同于grep g grep.txt
grep 'go*g' grep.txt --只要两个g字母中间有零个o或多个o就可以
grep 'g.*g' grep.txt --只要两个g字母中间有零个或任意个字符就可以
grep 'go.*g' grep.txt --只要go与g字母中间有零个或任意个字符就可以
/etc/passwd
grep ^...t /etc/passwd --查找每行里第四个字符为t的行
grep o.....$ /etc/passwd --查找每行里倒数第六个字符为o的行
grep s..n /etc/passwd --查找每行里有s和n字符,并且中间有两个字符的行
grep x:4: /etc/passwd --查找uid为4的行(只使用grep和正则表达式,不使用cut或awk的截取)
grep .*:.:4:.*:.*:.*:.* /etc/passwd --查找uid里是4的行
grep .*:.:.*4.*:.*:.*:.*:.* /etc/passwd --查找uid里包括4的行
grep .*:.*:.*:.*::.*:.* /etc/passwd --查找/etc/passwd里注释列为空的行
grep -v .*:.*:.*:.*::.*:.* /etc/passwd --查找/etc/passwd里注释列不为空的行
grep .*:.*:.*:.*:..*:.*:.* /etc/passwd
grep .*:[!x].*:.*:.*:.*:.*:.*:.*:.* /etc/shadow --查找不能在登录界面用密码正常登录的用户
grep root /etc/passwd -- 过滤关键字
grep '^root' /etc/passwd -- 以 root 开头的行
grep 'bash$' /etc/passwd -- 以 bash 结尾的行
grep '^$' /etc/passwd -- 查找空行
grep '^[ru]' /etc/passwd -- r 或 u
grep '[0-9]' /etc/passwd -- 查找数字
grep '^[^abc]' /etc/passwd -- 取反,非 a 非 b 非 c 开头
grep '\<root\>' /etc/passwd -- \< 取单词的头,\> 取单词的尾
grep -E '^root|^zhang' /etc/passwd --color -- 拓展正则 , -E,匹配以root 或 zhang 开头
grep -n root /etc/passwd -- 带行号过滤
grep -oE '(([0-9]{1,3}\.){3}[--9]{1,3})' /var/log/secure --在文本过滤IP地址
grep [[:digit:]] /etc/passwd
grep [[:lower:]] /etc/passwd
grep [[:upper:]] /etc/passwd
grep [[:space:]] /etc/passwd
grep [[:alnum:]] /etc/passwd