正则表达式:是一个描述字符集的对象。
一、正则表示式语法
1、直接量字符
字符 | 匹配 |
---|---|
字母和数字字符 | 自身 |
\o | NUL字符 |
\t | 制表符 |
\n | 换行符 |
\v | 垂直制表符 |
\f | 换页符 |
\r | 回车符 |
在正则表达式中,某些标点符号具有特殊含义:
^ $ . * + ? = | \ / () [] {}
如果想要在正则表达式中使用,则必须加"\"进行转义。
2、字符类
将直接量字符放进方括号就组成了字符类,一个字符类可以匹配他所包含的任意字符。
字符 | 匹配 |
---|---|
字母和数字字符 | 自身 |
[...] | 方括号内的任意字符 |
[ ^...] | 不在方括号内的任意字符 |
. | 除了回车符和换行符之外的所有字符 |
\w | 单词字符(字母、数字、下划线) |
\W | 非单词字符 |
\s | 空白符 |
\S | 非空白符 |
\d | 数字符 |
\D | 非数字 |
[\b] | 退格直接量(特例) |
3、边界
字符 | 匹配 |
---|---|
^ | 以xx开头 |
$ | 以xx结尾 |
\b | 单词边界,指[a-zA-Z_0-9]之外的字符 |
\B | 非单词边界 |
4、重复
之前介绍的匹配都是一一匹配,两位数匹配\d\d,四位数\d\d\d\d。
表示这种情况的字符定义--重复字符语法:
字符 | 匹配 |
---|---|
{n,m} | 匹配前一项n-m次 |
{n,} | 匹配前一项n以上次数 |
{n} | 匹配前一项n次 |
? | 匹配前一项最多一次{0,1} |
+ | 匹配前一项最少1次{1,} |
* | 匹配前一项0或多次{0,} |
例子:
/\d{2,4}/ //匹配2-4个数字
/\w{3}\d?/ //匹配3个单词字符和一个可选数字
/\s+java\s+/ //匹配前后带有一个或者多个空格的字符串“java”
/[^(]*/ //匹配一个或多个非"("的字符
- 贪婪匹配
对于{n,m},当出现多于m次符合条件的字符,将尽可能多的匹配,而且允许后续的正则表达式继续匹配。
'123456789'.match(/\d{3,5}/g); //["12345", "6789"]
- 非贪婪匹配
让正则表达式尽可能少的匹配。只需在待匹配的字符后面跟随:"??"、"+?"、"*?"。
'123456789'.match(/\d{3,5}?/g); //["123", "456", "789"]
5、选择、分组、引用
"|"
用于分隔供选择的字符。
注意:选择项的匹配次序是从左至右,直到发现匹配项,就忽略右边的。
'ab'.match(/a|ab/) //["a"]
"()"
① 可以组合"|"、"*"、"+"处理单元项:/java(script)?/、/(ab|cd)+|ef/
② 在完整的模式中定义子模式。当一个字符串和模式相匹配时,可以从子模式"()"中找到字符串中这部分匹配:/[a-z]+\d/、/[a-z]+(\d)/我们就可以从匹配的字符串中抽出数字。
③ 允许在同一正则表达式的后部引用前面的子表达式,这是通过在""加数字来实现:\1 引用的是第一个带圆括号的子表达式,\3 引用的是第三个带圆括号的子表达式。
字符 | 含义 |
---|---|
竖线 | 选择,匹配该符号左边的子表达式或右边的 |
(...) | 组合,而且可以记住与这个组合匹配的字符以供此后的引用 |
(?:...) | 只组合,但不记忆与该组匹配的字符 |
\n | 和第n个分组第一次匹配的字符相匹配,组索引是从左到右的'('数,'(?:'不计入索引 |
6、正则表达式标识符
字符 | 含义 |
---|---|
i | 执行字符串匹配时不区分大小写 |
g | 找到字符串中所有匹配,而不是找到一个就停止 |
m | 多行匹配模式,^匹配一行的开头和字符串的开头,$匹配行的结束和字符串的结束 |
一个正则表达式就是一个模式与上面三个标志的结合。
二、模式匹配的方法
- String方法
1、search() 参数是一个正则表达式(如果不是,首先会通过RegExp构造函数将他转换成正则表达式),返回第一个与之匹配的字符串的起始位置,如果找不到,返回-1。
PS:search方法不支持全局检索,他会忽略正则表达式中的修饰符g。
2、replace() 用以执行检索与替换,第一个参数是一个正则表达式,第二个是要替换的字符串。如果第一个参数是一个字符串,则replace将直接搜索这个字符串进行替换。
3、match() 唯一参数是一个正则表达式(或是通过RegExp构造函数将其转换为正则表达式),返回的是一个由匹配结果组成的数组。
如果是全局检索,则返回匹配的所有字符串数组。
如果不是全局检索,则返回第一个匹配字符串数组:数组第一个元素是匹配的字符串,余下的元素是是正则表达式中使用圆括号括起来的子表达式。
var test='Visit my blog at http://www.example.com/~david';
var url=/(\w+):\/\/([\w.]+)\/(\S*)/;
test.match(url);
//["http://www.example.com/~david", "http", "www.example.com", "~david"]
- RegExp实例方法
1、exec() 接受一个参数,要匹配的字符串,属性:index和input。
① 设置全局属性,每次只返回一个匹配项,第一次调用返回第一个匹配,第二次调用返回第二个匹配,lastIndex属性会增加。
② 不在全局下,在统一字符串上多次调用exec()将始终返回第一个匹配项,lastIndex始终保持不变。
var text="cat,bat,sat,fat";
var pattern1=/.at/;
var matchs=pattern1.exec(text);
alert(matchs.index); //0
alert(matchs[0]); //cat
alert(matchs.lastIndex); //0
matchs=pattern1.exec(text);
alert(matchs.index); //0
alert(matchs[0]); //cat
alert(matchs.lastIndex); //0
var pattern2=/.at/g;
var matchs=pattern2.exec(text);
alert(matchs.index); //0
alert(matchs[0]); //cat
alert(matchs.lastIndex); //3
matchs=pattern2.exec(text);
alert(matchs.index); //5
alert(matchs[0]); //bat
alert(matchs.lastIndex); //8
听人家说要想把正则表达式学得好,推荐看《精通正则表达式》,今天就学到这里。
常用的验证
1、邮箱验证
/^\w+[\.\w]*@\w+[\.\w]+[^\.]$/
2、电话验证
写一个正则,验证电话号码:格式为:"区号-号码",其中区号是010、或者02N、0NNN,号码是7-8位数字。
/^0(10|2\d|\d{3})-\d{7,8}$/