1.正则规则:
\d 数字
\w 数字或者字母
. 可以匹配任意字符
星号* 表示任意个字符
+ 表示至少一个字符
? 表示0或者1个字符
{n} 表示n个字符
{n,m} 表示n-m个字符
\s 表示空白符
括号[] 表示范围,比如:
[0-9a-zA-Z\_] 可以匹配一个数字、字母或者下划线
^ 表示行的开头,^\d表示必须以数字开头。
$ 表示行的结束,\d$表示必须以数字结束。
A|B 可以匹配A或B,如(P|p)ython可以匹配'Python'或者'python'
() 表示的就是要提取的分组(Group),如
2.常用公式:
.* 匹配任意字符,不限长度
.? 匹配0或者1个字符
.*? 匹配出多个结果
.+? 匹配出多个结果
.{length} 定长切割字符串(注意最后不足长度的部分不会进行匹配)
比如 \s{3} 表示匹配三个空格,\s{1,3}表示匹配一到三个空格
A|B 可以匹配A或B,如(P|p)ython可以匹配'Python'或者'python'
(2[^.*]4) 匹配 字符串以2开头4结尾
^1.*5$ 多行时,匹配以1开头,以5结尾