JavaScript中通过内置对象RegExp支持正则表达式
有两种实例化方法RegExp的方法
1.字面量
var reg = /\bis\b/g
2.构造函数
var reg = new RegExp('\\bis\\b', 'g')
1.正则表达式修饰符
g:global 全文搜索,不添加,搜索到第一个匹配就停止
i: ignore case 忽略大小写
m:multiple lines 多行搜索
2.元字符
正则表达式由两种基本类型字符组成
-原义文本字符
-元字符: 不代表它本身的意思,有特殊含义的字符
正则中常用元字符:
1.字符类
[abc] 匹配abc字符类中的一个
[^abc] 匹配不是abc中的一个
2.范围类 [a-zA-Z],[0-9],[0-9-]
3.预定义类
4.边界
5.量词
6.分组
7.忽略分组
不希望捕获某些分组,在分组内加?:可忽略分组
'2021-09-02'.replace(/(?:\d{4})-(\d{2})-(\d{2})/g, '$1')
//"09", $1为匹配到的第一组的引用
'2021-09-02'.replace(/(\d{4})-(\d{2})-(\d{2})/g, '$1')
//"2021",$1为匹配到的第一组的引用
3.贪婪模式和非贪婪模式
'12121212'.replace(/\d{3,6}/ , 'X')
//"X12" 尽可能多的匹配, 如果希望尽可能少的匹配可使用非贪婪模式,量词后面加?
'12121212'.replace(/\d{3,6}?/ , 'X')
//"X21212"
4.反向引用
'2021-09-02'.replace(/(\d{4})-(\d{2})-(\d{2})/g, '$2/$3/$1')
//"09/02/2021 可通过分组引用修改最终字符格式
5.前瞻
正则表达式是从头向尾部解析,所以文本尾部的方向就是前
前瞻就是匹配的时候向前看看,是否符合某个断言,javascript 不支持后顾
也就是匹配某个正则后,还没完还要看看是否符合某个断言
正向前瞻 ?=
'a2ta*3'.replace(/\w(?=\d)/g, 'X')
//"X2ta*3" 匹配到单词字符a后向前看看有数字吗,有成功匹配a,其他字符均不符合此规则
负向预查 ?!(查找后面不是某个断言)
'a2ta*3'.replace(/\w(?!\d)/g, 'X')
//"aXXX*X"
6.Js对象属性
var reg = /\d/
reg.global
//false
reg.ignoreCase
//false
reg.multiline
//false
reg.lastIndex
//0
reg.source
//"\\d"
7.正则表达式的方法test exec
test检测字符串是否匹配, 带g标志时要注意lastIndex的变化
var reg = /\w/;
var reg1 = /\w/g;
reg.test('ab')
//true
reg.test('ab')
//true
reg.test('ab')
//true
reg1.test('ab')
//true
reg1.test('ab')
//true
reg1.test('ab')
//false
while(reg1.test('ab')){
console.log(reg1.lastIndex)
}
//1
//2
exec使用正则对字符串进行搜索,没有匹配返回null,匹配则返回结果数组,数组还有两个属性
---- index匹配文本第一个字符的位置
---- input存放被检索的字符串string
非全局调用时返回数组
- 第一个元素与正则相匹配的文本
- 与第一个分组相匹配的文本
- 与第二个分组相匹配的文本,以此类推
var reg = /\d(\w)\d/;
var str = '*3d45df5gg6';
var ret = reg.exec(str);
//Array
//0: "3d4"
//1: "d"
//groups: undefined
//index: 1
//input: "*3d45df5gg6"
//length: 2
var reg = /\d(\w)\d/g;
var str = '*3d45d5gg6';
while(ret=reg.exec(str)){
console.log(reg.lastIndex+'\t'+ret.toString())
}
//4 3d4,d
//7 5d5,d
8.字符中正则相关方法
String.prototype.search 返回index 忽略g标志
String.prototype.match 返回值非全局调用时同exec,全局调用时只返回匹配到的字符数组
var reg = /\d(\w)\d/g;
var str = '*3d45d5gg6';
str.match(reg);
//["3d4", "5d5"]
String.prototype.split 可以用正则分割
'a|b,c'.split(/\W/g) //["a", "b", "c"]
String.prototype.repalce找到,替换
String.prototype.repalce(str, replaceStr)
String.prototype.repalce(reg, replaceStr)
String.prototype.repalce(reg, function)
function 四个参数,有匹配结果的回调
---匹配结果
---分组内容(有0到多个参数)
---匹配项在字符串中index
---原字符串
'a1b2c3d4'.replace(/\d/g, function(match, index, origin){
return parseInt(match)+1
})
//"a2b3c4d5"
'a1b2c3d4e5'.replace(/(\d)(\w)(\d)/g, function(match, group1, group2, group3, origin){
return group1+group3
})
//"a12c34e5"
相关工具网站:https://ihateregex.io/expr/username; https://regexper.com/;https://github.com/ziishaned/learn-regex/blob/master/translations/README-cn.md;http://jsbin.com/?js,console