作者:烨竹
正则表达式理解:
正则表达式是一种用来匹配字符串的规则;
正则对象:
在JS中,一切皆对象 想要使用正则,必须创建正则对象
实例化构造器: new RegExp(‘正则表达式’);
正则相关6大方法(重点):
正则对象.test(字符串); 返回布尔值
检验字符串中是否有符合正则对象描述的子串
正则对象.exec(字符串); 捕获子串 返回数组 每调用一次捕获一个结果z 检验字符串中是否含有复合正则对象描述的子串 如果有,捕获起来 返回数组结果
exec() 方法
用于检索字符串中的正则表达式的匹配
结合while和子表达式使用
字符串.search(正则对象); 返回子串首次出现的位置 如果没有返回-1
在字符串中,匹配是否含有符合正则描述的子串 如果有,返回索引
字符串.match(正则对象);返回数组 调用一次捕获所有结果(全局匹配模式)
在字符串中,匹配是否含有符合正则描述的子串 如果有,返回数组
字符串.replace(正则对象,新字符串); 在字符串中,用新字符串替换旧字符串
匹配字符串中是否含有符合正则对象描述的子串 如果有,用新字符串替换这些子串
字符串.split(正则对象); 根据子串把字符串拆分成数组
匹配字符串中是否含有符合正则对象描述的子串 以这些子串为分界线 划开字符串
匹配模式
正则表达式: /表达式/匹配模式;
g: global 全局匹配 在字符串的所有位置尝试匹配
i: ignore 忽略大小写
常见元字符(必须记忆):
\d : 匹配数字
\D: 匹配非数字
\w: word 匹配单词字符 小写字母、大写字母、下划线_、数字
\W: 非单词字符
\s: 空白字符 看不见但实际存在的字符 空格、换行符、制表符tab
\S: 非空白字符
.(英文句点): 任意字符
正则三步走
查什么(匹配符)
查什么,主要是抓住子串的特征,主要依靠匹配符来表示
① : 匹配普通字符:
② : 匹配字符串中的奇数数字:用[]构建范围类 [13579]表示可以从奇数中匹配
③ : 匹配所有数字: [0-9] 在方括号中,可以用中划线-代表一种连续的范围
④ : 匹配偶数:匹配除了奇数以外的就是偶数 ^表示逻辑非
⑤ : 匹配中文: 虽然汉字本身不具有连续性,但是它们在计算机中占据了一块连续的字符编码. \u4e00-\u9fa5
⑥ : 用匹配符,可以十分方便地描述字符串特征:
普通字符:查什么就是什么
如果查询多种字符: []建立范围类 [a-z] [13579]
\d : 查数字 等价于[0-9]
\D: 查非数字 等价于[^0-9]
\w: 单词字符 等价于[a-zA-Z_0-9]
\W: 非单词字符 等价于[^a-zA-Z_0-9]
中文: 中文本身是普通字符 但是为了方便以字符编码构建范围类
[\u4e00-\u9fa5]
查多少(限定符)
① : 查连续4位数字: 用{}构建量词
查什么:数字 查多少:4位 /\d{4}/
② : 匹配连续的3到6位数字 量词可以表达范围 {N,M}
查什么:数字 查多少:3~6位 /\d{3~6}/
③ : 匹配至少4位连续数字 {N,} 至少要N位
查什么:数字 查多少:至少4位
④ : 贪婪模式与非贪婪模式:
系统默认会以量词范围的上限,尽可能长地匹配结果,这种模式成为贪婪模式(饿汉模式)
可以在量词后,加一个?号,切换到非贪婪模式(饱汉模式),尽可能短地匹配结果:
⑤ : 用限定符(量词),可以十分方便地描述要匹配的字符数量:
用{}构建量词,有三种写法 {N} {N,M} {N,}
还有一些方便的量词:
*: 任意个数 等价于:{0,}
+: 至少一个 等价于:{1,}
?: 0个或1个 等价于:{0,1}
在哪查(定位符)
① :匹配表单中的手机号码:
查什么:数字 查多少:11位
在正则中,^代表一个字符串开始的位置(最左边的位置)
在正则中,$代表一个字符串结束的位置(最右边的位置)
上述需求非常常见,无论是身份证、手机、邮箱等表单信息,都不允许出现杂质。
/^表单数据$/ 避免杂质的混入
② :匹配一段英文字符串中的单词an
zhangsan have an apple
在英语中,两个单词之间有空格 正则中,有单词边界用 \b 表示。
p1: 查什么:单词边界 查多少:1个 在哪查:任意
p2 : 查什么:an 查多少:1个 在哪查:紧跟p1
p3 : 查什么:单词边界 查多少:1个 在哪查:紧跟p2
/\ban\b/g
③ :匹配zhangsan姓名中的最后一个an
在正则中,有非单词边界用 \B 表示:
p1:查什么:非单词边界 查多少:1个 在哪查:任意位置
p2:查什么:an 查多少:1个 在哪查:紧跟p1
p3:查什么:单词边界 查多少:1个 在哪查:紧跟p2
/\Ban\b/g
④ :需求中与特定位置相关的,一般用定位符来表达:
^ : 字符串最左边(起始标签)
$ : 字符串最右边(结束标签)
\b: 单词边界 单词与空格之间的位置
\B: 非单词边界 字母之间的位置
正则三技术
分组技术 ()用圆括号定一个分组
选择技术 选择匹配符|
预查技术 正向预查语法:(?=要预查的子串) ;;;反向预查:(?!要预查的子串)