学习Vue中那些正则表达式

想看懂Vue的template解析部分,会发现其中有大量的正则表达式。所以先学习基础知识。

其实正则表达式并不难,关键在于拆分理解,并且经常使用。就可以很好的熟悉正则表达式了。具体语法可参照正则表达式 - JavaScript | MDN

正则用法

在JavaScript中正则表达式用法为:

/正则表达式特殊字符/修饰符(可选)

特殊字符

这里列一下正则的特殊字符及其用法,加深理解和映象。

  • \ 将字符变为特殊或非特殊字符。如 n 变为换行符 \n,特殊符号 ( 变为字符 \(
  • ^ 匹配字符串起始位置。
  • $ 匹配字符串结束位置。
  • * 匹配前面的子表达式零到多次。
  • + 匹配前面的子表达式一到多次。
  • ? 匹配前面的子表达式零到一次。
  • {n} 匹配前面的子表达式的n个,如 o{2} 能够匹配 food 不能匹配 god
  • {n,} 至少匹配n个前面的子表达式,如 o{2,} 能够匹配 fooooood 不能匹配 god
  • {n, m} 至少匹配n次,至多匹配m次。
  • 非贪婪模式 默认为贪婪模式,如 o+ 将匹配 foooood 的所有 o。而非贪婪模式(在匹配符后面加 ?),如 o+? 则只会匹配一个o
  • . 匹配除换行符外任何单个字符。换行符为 \n\r
  • (x) 捕获括号,匹配并记住匹配项。
  • (?:x) 非捕获括号,匹配并不记住匹配项。如 /(?:foo){1,2}/,这里将 foo 作为一个整体进行匹配1到2次。
  • x(?=y) 匹配x仅仅在x后面跟y的时候。?=y 表示字符串末尾是y。
  • x(?!y) 匹配x仅仅在x后面不跟着y的时候。?!y 表示字符串末尾不是y。
  • x|y 匹配 x 或 y,如 jack|rose 就可以匹配到 jack 和 rose 两个字符串。
  • [xyz] 匹配方括号内任意字符。
  • [^xyz] 反向字符集,匹配除方括号内字符的任意字符。
  • [0-9] 范围匹配,匹配0-9范围内任意字符。
  • \w 查找单词字符。单词字符包括:a-z、A-Z、0-9,以及下划线。
  • \W 查找非单词字符。
  • \d 查找数字字符。
  • \D 查找非数字字符。
  • \s 查找空白字符。空白字符包括空格、\n、\f、\r、\t、\v。
  • \S 查找非空白字符。
  • \b 匹配单词边界,通常匹配单词开头和结尾。如 /\bcd/ 匹配 cdkey
  • \B 匹配非单词边界。如 /\Bcd/ 匹配 abcd
  • \O 查找 NULL 字符。
  • \n 换行符。
  • \f 换页符。
  • \r 回车符。
  • \t 制表符。
  • \v 垂直制表符。

修饰符

  • i 执行对大小写不敏感的匹配。
  • g 执行全局匹配。
  • m 执行多行匹配。

简单正则实例分析

上面介绍了正则的简单用法,下面收集一些简单的正则进行分析。

/^[0-9]*$/

0-9范围内0到多个数字的组合,且字符开头结尾都是0-9的数字。即表示整数。如 1314、0

/^\d{m,n}$/

匹配m-n位的数字。由于开头结尾都是数字,所以它是一个固定长度的纯数字。

/^\-[1-9][0-9]*$/

匹配-开头,数字结尾,第一个字符为1-9,随后0-n个字符为0-9的字符。即非零负整数。

/^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$/

这是匹配邮件的一个正则,我们一点点看。
开头匹配1-n个单词字符;
括号里匹配 [-+.] 字符加上1-n个单词字符,括号内容匹配0-n次;
加上@字符;
加上1-n个单词字符字符
括号里匹配 [-.] 字符加上1-n个单词字符,括号内容匹配0-n次;
加上.字符
加上1-n个单词字符字符
括号里匹配 [-.] 字符加上1-n个单词字符,括号内容匹配0-n次;
结尾;
这里考虑了很多因素邮箱命名因素,一般的邮箱地址像 475966597@qq.com 这种肯定是没问题的。所以,我极端测试来展现它列出的可能性,结果如下(我把所有可能性都符合了一遍):

正则测试结果

/^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\d{8}$/

再来看个手机号验证。一步步来:
开头匹配手机号前三位是 13[0-9] 或 14[5|7] 或者 15[0|1|2|3|5|6|7|8|9] 或 18[0|1|2|3|5|6|7|8|9];
匹配后八位数字为0-9的字符;
结束。

/^[1-9]\d{5}[1-9]\d{3}((0\d)|(1[0-2]))(([0|1|2]\d)|3[0-1])\d{4}$/

这是验证身份证的正则,来看看:
开头为一个1-9的数字;
加上五位0-9的数字;
加上一位1-9的数字;
加上三位0-9的数字;
加上 0/d 或者 1[0-2],即月份 01、02……12;
加上 ([0|1|2]\d) 或者 3[0-1],即日起,01、13、25、31;
加上身份证末四位;

/^([a-zA-Z]+-?)+[a-zA-Z0-9]+\.[x|X][m|M][l|L]$/

这是xml文件命名正则。
开头为 1-n个 [a-zA-Z] 字符 加上 0-1个 - 组成;
括号内的内容可重复1-n次;
加上1-n个 [a-zA-Z0-9] 字符;
加上 ·.·;
加上 x 或 X;
加上 m 或 M;
加上 l 或 L;
结尾;

解析 Vue 源码中的正则

/;(?![^(]*\))/g

由于 ?! 符号,所以是匹配 ; 字符。
我们之前说过,?! 符号表示字符串末尾不是指定字符串。
这个指定字符串 [^(]*\) 解析为 0-n 个不为 ( 的任意字符加上 )
用例子说明。匹配条件为 ; 字符后面不能跟 ;xx)xx 但是可以跟 ;(xx)xx

/:(.+)/

以上正则表示匹配 : 加上 1-n 个 .

var defaultTagRE = /\{\{((?:.|\n)+?)\}\}/g;
var regexEscapeRE = /[-.*+?^${}()|[\]\/\\]/g;

defaultTagRE 的正则:匹配 {{ 字符,然后匹配非换行符或 \n (即排除了 \r),最后加上 }}
regexEscapeRE 的正则:全局匹配 -.*+?^${}()|[]/\。注意,只有在 ()| 才表示或,如 /(g|f)ood/

/&(?:lt|gt|quot|amp|#10|#9);/g

匹配 <>"&amp
	

var onRE = /^@|^v-on:/;  // 以@或v-on开头的字符
var dirRE = /^v-|^@|^:/; // 以v-、@、:开头的字符
var forAliasRE = /(.*?)\s+(?:in|of)\s+(.*)/; // 匹配如 item in list 或者 item of list
var forIteratorRE = /\((\{[^}]*\}|[^,]*),([^,]*)(?:,([^,]*))?\)/;

var argRE = /:(.*)$/; // 匹配 : 加上 0-n 个非换行字符结尾的条件
var bindRE = /^:|^v-bind:/; // 匹配 : 或 :v-bind 开头的字符
var modifierRE = /\.[^.]+/g; // 全局匹配 `.` 加上 1-n 个非 `.` 字符。

解析一下这个 forIteratorRE,其实就是看着乱。
先得到一个 ( 字符;
再获取 (\{[^}]*\}|[^,]*) ,这里匹配的是 { 加 0-n 个非 } 字符加 },或者 0-n 个非 , 字符。
加上字符 ,;
得到 ([^,]*) , 这里匹配的是 0-n 个非 , 字符;
得到 (?:,([^,]*))?\),加上字符 , 然后加上 0-n 个非 , 字符,这整个表达式,数量为 0-1;
最后加上 )
所以匹配字符串可以是 (,)({abc},wc,uvw)

/'(?:[^'\\]|\\.)*'
|"(?:[^"\\]|\\.)*"
|`(?:[^`\\]|\\.)*\$\{
|\}(?:[^`\\]|\\.)*`
|`(?:[^`\\]|\\.)*`/g

以上正则看似很长,其实通过 | 或关系进行拆分,敲回车便于查看后发现,其实是由五个表达式组合起来的。
逻辑差不多,看第一个表达式:先添加' ,然后添加0-n个非 '\ 的字符,最后加上 '。如 'abc'

/-(\w)/g

先添加 - 字符,再添加单词字符,进行匹配。

/\B([A-Z])/g

不在单词边界上的 A-Z 的字母字符,如 rAr

/(?:^|[-_])(\w)/g

字符串第一个字符为单词字符,或者以 [-_] 加字符形式出现的匹配。

/^\s*([^\s"'<>\/=]+)(?:\s*(=)\s*(?:"([^"]*)"+|'([^']*)'+|([^\s"'=<>`]+)))?/

再长的正则拿到手就需要进行拆分:
^\s* 表示以0-n个空白字符开头;
([^\s"'<>\/=]+) 表示有1-n个非 空白字符、"'<>\/=的字符。
最后一个表达式较长,而且由于表达式最后有 ?,所以这段表达式可以不匹配。先是0-n个空白字符,加上 = 号,加上 0-n 个空白字符。之后有三种情况:情况一:加上 ,加上 0-n 个非空白字符,再加上1-n个 ;情况二:加上 ',加上 0-n 个非空白字符,再加上1-n个 ';情况三:加上1-n个非 空白字符、"'=<>、` 的字符。

最后

正则表达式看到这也算是有了一定了解了。
其实只要懂得正则基本语法、然后耐心去看去理解,会发现正则也不是那么难的。
这里推荐 https://regex101.com/#javascript 这个工具,本博客就是一边用这个工具实践验证一边写的,非常好用!
我先通过猜测理解正则大致意思,然后用这个工具去验证,验证成功,反推回来更好理解正则表达式。
就是这样!

明日预告

既然正则被我们搞定了,那么明天写 Vue 的 template 解析问题就不大啦。敬请期待~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342

推荐阅读更多精彩内容

  • 最近在学PHP,js时需要用到正则表达式,尽管在学Python时学了一些但是不够系统。每次看到繁琐的正则,就浅尝辄...
    zjbao123阅读 466评论 0 2
  • 正则表达式练习题点击这里 创建一个正则表达式 使用一个正则表达式字面量,其由包含在斜杠之间的模式组成,如下所示: ...
    打铁大师阅读 1,237评论 0 6
  • 一.正则表达式匹配原则 占有字符和零宽度 在正则表达式匹配过程中,如果子表达式匹配到的是字符内容,并被保存在结果之...
    Coree阅读 523评论 0 0
  • 正则表达式到底是什么东西?字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等...
    狮子挽歌阅读 2,134评论 0 9
  • 一,选择商业综合体的考量。 1 业主如何实现对运营商的监管。业主权益如何得到保障。 2运营商的运营水平。 3是否存...
    取个昵称都好难阅读 747评论 0 1