正则表达式学习(js)
概览
先拿数字举例
符号 | 含义 |
---|---|
\d | 数字 |
\d? | 0个或1个数字 |
\d+ | 1个或多个数字 |
\d* | 0个或多个数字 |
\d{3} | 3个数字 |
\d{3,5} | 3个到5个数字 |
几个常用的例子
-
单词边界\b
比如我们就像匹配单词
is
,像qishi
这样的不要匹配,我们就需要\bis\b
-
点.表示任意字符
如果我们就需要匹配点.,那我们就需要转义
\.
-
匹配
//
网址中经常有
//
,要匹配这个,也需要转义\/\/
-
分组()
分组之后,我们可以提取其中的内容
-
或者[]
在匹配日期中,
[-/]
,就可以要么匹配-
,要么匹配/
-
开头、结尾
^表示以什么开始,$表示以什么结束
正则对象
创建一个正则对象
var reg = new RegExp('\\bis\\b','g')
\\
,第一个是为了转义,第二个是配合后面的\b
修饰符
- g: global 表示全文搜索
- i: ignore case 忽略大小写。默认大小写敏感
- m:multiple lines 多行搜索
多行匹配就是让后面的行同样适用于第一行的规则。
没加换行修饰符
第二行,第三行的都没有匹配到。
如果我们加上换行修饰符
元字符
正则表达式由两种基本字符组成,一类是原义文本字符,写什么就匹配什么,我们看到的就是要匹配的。第二类就是元字符,元字符就是在正则表达式中有特殊含义的非字母字符。
字符类
我们使用[]
构造了一类字符,这一类字符中,可以是abc中的任意一个。
字符类取反
范围类
如果我们要需要一个类,包括数字从5到9,我们需要这样[5 6 7 8 9]
,如果数字多的话,会很麻烦
所以就需要范围类了
连写
[a-zA-Z],就把大小写都包括了。
如果我们不光包括大小写,还需要包括-
[a-zA-Z-],后面加一个-
就可以了。
js预定义类和边界
上一节中,看到我们可以自定义类,这样已经方便了我们书写,但是还不够,为此,正则表达式还给我们提供了预定义类来匹配常见的字符类。
我们可以自己构造:
ab[0-9][^\r\n]
也可以使用正则的预定义类
ab\d.
边界
举例
量词
我们希望匹配一个连续出现20次的数字的字符串
好麻烦
贪婪模式和非贪婪模式
这个会匹配多少?
默认是贪婪模式,会都匹配。
如果我们想让它尽可能少的匹配,我们就设置为非贪婪模式。
举例:
分组
我们有这样的场景,匹配字符串Byron
出现三次的场景。
学习了量词之后,我们可以这样:Byron{3}
但是这并不是我们需要的,因为它代表的是n
出现三次。
或
上面的例子,如果我们只是想把或作用on
或Ca
,我们可以这样
反向引用
场景:
不光是
-
变成了/
,日期的顺序也变了。
我们要替换的内容还在字符串本身里面,就相当于变量的概念了。
note:如果没有分组的话,$就表示原义了。
忽略分组
前瞻和后顾
举例
这里的(?=\d)
不是正则部分,它是类型断言部分。