一、匹配符
\:指出接着的字符为特殊字符。
^:表示匹配的字符必须在最前边。
$:表示匹配的字符必须在最后边。
*:匹配*前面的字符0次或n次。
+:匹配+前面的字符1次或n次。
?:匹配?前面的字符0次或1次。
.:匹配除换行符外的所有单个的字符。
(x):匹配“x”并记录匹配的值。匹配子串能被结果数组中的素[1],...,[n]返回,或被RegExp对象的属性$1...$9返回。
x|y:匹配“x”或者“y”。
{n}:这里n是一个正整数。匹配前面的n个字符。
{n,}:这里n是一个正整数。匹配至少n个前面的字符。
{n,m}:这里n是一个正整数。匹配至少n个最多m个前面的字符。
[xyz]:字符列表,匹配列出的任意字符。可以通过连字符“-”指出一个字符范围。
[^xyz]:字符补集,匹配除了列出的字符外的所有东西。可以使用连字符“-”指出一个字符范围。
[\b]:匹配一个空格(与“\b”不同)。
\b:匹配一个单词的分界线,如一个空格(与“[\b]”不同)。
\B:匹配一个单词的非分界线。
\cX:X是一个控制字符。匹配一个字符串的控制字符。
\d:匹配一个数字,等价于“[0-9]”。
\D:匹配任何的非数字,等价于“/[^0-9]/”。
\f:匹配一个表单符。
\n:匹配一个换行符。
\r:匹配一个回车符。
\s:匹配一个单个white空格符,包括空格、tab、form feed、换行符,等价于“[\f\n\r\t\v]”。
\S:匹配一个制表符。
\t:匹配一个制表符。
\v:匹配一个顶头制表符。
\w:匹配所有的数字和字母以及下划线,等价于“/[A-Za-z0-9_]/”。
\W:匹配除数字、字母以及下划线外的其他字符,等价于“/[^$A-Za-z0-9_]/”。
二、创建RegExp
1、显示构造:new RegExp("pattern"[,"flags"]);
2、隐式构造:/pattern/[flags];
pattern:必填项,正则表达式模式;
flags:可选项,包括g、i、m。
1)g:全局标志。设置后,对文本执行搜索和替换时,对文本中所有匹配的部分起作用;未设置时,只搜索和替换最早匹配的内容。
2)i:忽略大小标志。设置后,匹配比较时,忽略大小写。
3)m:多行标志。设置后,“^”可与被搜索字符串中的“\n”或“\r”之后的位置(即下一行的行首)相匹配,“^”也可与被搜索字符串中的“\n”或“\r”之后的位置(即下一行的行尾)相匹配;未设置时,“^”只与被搜索字符串的开始位置相匹配,“$”也只与被搜索字符串的结束位置相匹配。
三、使用方法
rgExp:包含正则表达式模式和可用标志的正则表达式对象。
stringObj:要在其上进行查找的String对象或字符串文字。
str:要在其上进行查找的String对象或字符串文字。
1、rgExp.exec(str):如果未找到匹配,则返回null;如果找到匹配,则返回一个数组。若设置了全局标志,则以lastIndex的值指示的位置开始查找;若未设置全局标志,则从字符串的起始位置开始搜索。返回的数组包括input、index和lastIndex三个属性。input属性包含了整个被查找的字符串;index属性中包含了整个被查找字符串中被匹配的子字符串的位置;lastIndex属性中包含了匹配中最后一个字符的下一个位置。
2、rgExp.test(str):检查在字符串中是否存在相应的匹配。如果存在则返回true,否则返回false。
3、stringObj.match(rgExp):(与rgExp.exec(str)类似)如果未找到匹配,则返回null;如果找到匹配,则返回一个数组。返回的数组包括input、index和lastIndex三个属性。input属性包含了整个被查找的字符串;index属性中包含了整个被查找字符串中被匹配的子字符串的位置;lastIndex属性中包含了匹配中最后一个字符的下一个位置。
4、stringObj.search(rgExp):检查在字符串中是否存在相应的匹配。如果存在,则返回一个整数值,指明这个匹配距离字符串开始的偏移位置;如果没有,则返回-1。
5、relpace(rgExp.replaceText):rgExp为字符串时,不按正则表达式的方式进行模糊搜索,而进行精确搜索。replaceText为用于替换搜索到的内容的字符串,可以使用特殊的字符组合来表示匹配变量。其中,“$&”是整个表达式模式在被搜索字符串中所匹配的字符串;“$”是表达式模式在被搜索字符串中所匹配的字符串左边的所有内容;“$'”是表达式模式在被搜索字符串中所匹配的字符串右边的所有内容;“$$”则是普通意义的“$”字符。$1…$9分别是第1个到第9个子匹配所捕获到的内容,$01…$99分别是第1个到第99个子匹配所捕获到的内容,当$n和$nn(n为正整数)在表达式中没有对应的子匹配时,被解释成普通字符。
eg.字符串替换
var str = "aa12bb34cc56";
var ex = /(\d)(\d)/gi;
var str1 = str.replace(ex,"$2$1");
console.log(str1); //输出结果:aa21bb43cc65
6、split([separator[,limit]]):separator为分割标志符参数,可也为多个字符或一个正则表达式;limit为限制返回元素的个数。
eg.字符串分割
var arr = new Array();
var str = "How、are、you、!";
var ex = /、/;
arr = str.split(ex);
console.log(arr[i]); //输出结果:["How", "are", "you", "!"]
四、实际应用【转载来源】(有改动)
a.校验数字的表达式
1、数字:^[0-9]*$
2、n位的数字:^\d{n}$
3、至少n位的数字:^\d{n,}$
4、m-n位的数字:^\d{m,n}$
5、零和非零开头的数字:^(0|[1-9][0-9]*)$
6、非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(.[0-9]{1,2})?$
7、带1-2位小数的正数或负数:^(\-)?\d+(\.\d{1,2})?$
8、正数、负数、和小数:^(\-|\+)?\d+(\.\d+)?$
9、有两位小数的正实数:^[0-9]+(.[0-9]{2})?$
10、有1~3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$
11、非零的正整数:^[1-9]\d*$ 或 ^([1-9][0-9]*){1,3}$ 或 ^\+?[1-9][0-9]*$
12、非零的负整数:^\-[1-9][]0-9"*$ 或 ^-[1-9]\d*$
13、非负整数:^\d+$ 或 ^[1-9]\d*|0$
14、非正整数:^-[1-9]\d*|0$ 或 ^((-\d+)|(0+))$
15、非负浮点数:^\d+(\.\d+)?$ 或 ^[1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0$
16、非正浮点数:^((-\d+(\.\d+)?)|(0+(\.0+)?))$ 或 ^(-([1-9]\d*\.\d*|0\.\d*[1-9]\d*))|0?\.0+|0$
17、正浮点数:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$ 或 ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$
18、负浮点数:^-([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ 或 ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$
19、浮点数:^(-?\d+)(\.\d+)?$ 或 ^-?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$
b.校验字符的表达式
1、汉字:^[\u4e00-\u9fa5]{0,}$
2、英文和数字:^[A-Za-z0-9]+$ 或 ^[A-Za-z0-9]{4,40}$
3、长度为3-20的所有字符:^.{3,20}$
4、由26个英文字母组成的字符串:^[A-Za-z]+$
5、由26个大写英文字母组成的字符串:^[A-Z]+$
6、由26个小写英文字母组成的字符串:^[a-z]+$
7、由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$
8、由数字、26个英文字母或者下划线组成的字符串:^\w+$ 或 ^\w{3,20}$
9、中文、英文、数字包括下划线:^[\u4E00-\u9FA5A-Za-z0-9_]+$
10、中文、英文、数字但不包括下划线等符号:^[\u4E00-\u9FA5A-Za-z0-9]+$ 或 ^[\u4E00-\u9FA5A-Za-z0-9]{2,20}$
11、可以输入含有^%&',;=?$\"等字符:[^%&',;=?$\x22]+
12、禁止输入含有~的字符:[^~\x22]+
c.特殊需求表达式
1、Email地址:^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$
2、域名:[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(/.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+/.?
3、InternetURL:[a-zA-z]+://[^\s]* 或 ^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$
4、手机号码:^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$
5、电话号码("XXX-XXXXXXX"、"XXXX-XXXXXXXX"、"XXX-XXXXXXX"、"XXX-XXXXXXXX"、"XXXXXXX"和"XXXXXXXX):^(\(\d{3,4}-)|\d{3.4}-)?\d{7,8}$
6、国内电话号码(0511-4405222、021-87888822):\d{3}-\d{8}|\d{4}-\d{7}
7、身份证号(15位、18位数字):^\d{15}|\d{18}$
8、短身份证号码(数字、字母x结尾):^([0-9]){7,18}(x|X)?$ 或 ^\d{8,18}|[0-9x]{8,18}|[0-9X]{8,18}?$
9、帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
10、密码(以字母开头,长度在6~18之间,只能包含字母、数字和下划线):^[a-zA-Z]\w{5,17}$
11、强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$
12、日期格式:^\d{4}-\d{1,2}-\d{1,2}
13、一年的12个月(01~09和1~12):^(0?[1-9]|1[0-2])$
14、一个月的31天(01~09和1~31):^((0?[1-9])|((1|2)[0-9])|30|31)$
15、钱的输入格式:
16、有四种钱的表示形式我们可以接受:"10000.00" 和 "10,000.00",和没有 "分" 的 "10000" 和 "10,000":^[1-9][0-9]*$
17、这表示任意一个不以0开头的数字,但是,这也意味着一个字符"0"不通过,所以我们采用下面的形式:^(0|[1-9][0-9]*)$
18、一个0或者一个不以0开头的数字.我们还可以允许开头有一个负号:^(0|-?[1-9][0-9]*)$
19、这表示一个0或者一个可能为负的开头不为0的数字.让用户以0开头好了.把负号的也去掉,因为钱总不能是负的吧.下面我们要加的是说明可能的小数部分:^[0-9]+(.[0-9]+)?$
20、必须说明的是,小数点后面至少应该有1位数,所以"10."是不通过的,但是 "10" 和 "10.2" 是通过的:^[0-9]+(.[0-9]{2})?$
21、这样我们规定小数点后面必须有两位,如果你认为太苛刻了,可以这样:^[0-9]+(.[0-9]{1,2})?$
22、这样就允许用户只写一位小数下面我们该考虑数字中的逗号了,我们可以这样:^[0-9]{1,3}(,[0-9]{3})*(.[0-9]{1,2})?$
23、1到3个数字,后面跟着任意个逗号+3个数字,逗号成为可选,而不是必须:^([0-9]+|[0-9]{1,3}(,[0-9]{3})*)(.[0-9]{1,2})?$
24、备注:这就是最终结果了,别忘了"+"可以用"*"替代如果你觉得空字符串也可以接受的话(奇怪,为什么?)最后,别忘了在用函数时去掉去掉那个反斜杠,一般的错误都在这里
25、xml文件:^([a-zA-Z]+-?)+[a-zA-Z0-9]+\\.[x|X][m|M][l|L]$
26、中文字符的正则表达式:[\u4e00-\u9fa5]
27、双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))
28、空白行的正则表达式:n[s|]*r
29、HTML标记的正则表达式:<(.*)>.*</1>|<(.*)/>
30、首尾空白字符的正则表达式:(^s*)|(s*$)
31、腾讯QQ号:[1-9][0-9]{4,} (腾讯QQ号从10000开始)
32、中国邮政编码:[1-9]\d{5}(?!\d) (中国邮政编码为6位数字)
33、IP地址:\d+\.\d+\.\d+\.\d+ (提取IP地址时有用)
34、IP地址:((?:(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d)\\.){3}(?:25[0-5]|2[0-4]\\d|[01]?\\d?\\d))