正则表达式最佳实践

Regular-Expressions

亲,我的简书已不再维护和更新了,所有文章都迁移到了我的个人博客:https://mikefighting.github.io/,欢迎交流。

作为一名开发人员,无论是前端,后端,移动端,都可能会接触到正则表达式,最常见的场景就是注册登录了,我们需要对电话号码或者邮箱做校验,如果对用户名有特殊字符有限制的话还会对特殊字符做校验。我们通常的做法就是百度或者谷歌,最后复制粘贴完事,对于那一串奇奇怪怪的字符串感觉很头大。接下来的这篇文章会向你详细解释正则表达式的语法,分析正则表达式,并且附带上常用的表格,最后给出IOS中用到正则表达式的两个类NSRegularExpressNSPredicate,NSString。

主要内容包括

一、简介
二、正则表达式的PlayGround
三、基本语法表及简介
四、正则表达式实例
五、正则表达式在IOS中
六、常用的正则表达式

一、简介

正则表达式就是一个用来检索或者替换合乎某种条件的一串字符集。

二、正则表达式的PlayGround

在学习正则表达式时,面对很多的长篇大论,可能比较枯燥无味,写代码跑项目又比较费时费力。regexpal网站需要翻墙)刚好可以解决我们的问题,它可以随时测试我们写的正则是否有误,并且有语法检查和语法提示。在接下来的说明中,可以边看边操作了。

正则表达式的PlayGround

三、基本语法表及简介

正则表达式常用指令集
  • 纯文本形式,比如a就将匹配文本中的a,如果Mike就会匹配文本中的Mike,文本之间是的关系。
  • ** 其中\是转意字符,表示该字符后面的字母有特殊含义,比如下面要说的\d,\b等,因为在很多语言中,比如0C,Swift中\已经是转意字符,所以需要\\b来表示\b的含义。
  • []匹配里面的任何一个字符,比如p[abcde],将匹配pa,pb,pc,pd,pe。当然可以换成p[a-e],其中-表示“至”的意思,[0-9]表示0到9间的任何一个数字。
  • {}如上表,表示的是匹配的次数,如{6},表示匹配六次,{5,}表示匹配5次以上。比较难以理解的是{2,4}?,这表示最少匹配两次,最多匹配四次,但是,如果四个字母同时出现了,就算两个匹配,如果三个字母出现了,就匹配两次。如:正则[A-Z]{2,3}?,检测MIKEF,就会产生两个匹配MIKE,可以在上文的网站中练习。
  • .匹配任何一个字符,比如M.M,匹配MuM,MdM,M@M,等。
  • \w匹配很像单词的字符,包含字母,数字,下划线,但是不包含标点符号,及其他字符,比如:hello\w,匹配hello_,hello8,但是不匹配hello!
  • \d匹配数字,其和[0-9]是同意的。例如\d\d?:\d\d就是可以匹配时间,比如12:309:20等。digital单词的首字母
  • \b表示文字的边界,比如空格和标点符号。如go\b将会匹配go home和go!但是不会匹配gone,在需要匹配整个单词的时候往往有用。boundary单词的首字母
  • \s表示空格以及新的一行。比如Hey\s将会匹配Hey man!中的Hey
  • ^表示一行的开头,比如^Hello将会匹配Hello Everyone!但是不会匹配He said Hello。注意:在[]里面的^表示的非的意思,如:[^DE]表示的是:不是DE的任何字符。
  • ****表示行的结尾,例如end将会匹配it was the end但是不会匹配the end is comming
  • *表示匹配其前面的字符0次或者很多次,如:go\*d,将会匹配good,goood,gooood,goooooood,gd等。
  • +表示匹配其前面的字符一次或者很多次,如:go+d将不会匹配gd
    注:关于强匹配的概念,如果想了解的可以!在正则ExpressionsInfo网站上学习,捕获的意思就是被捕获的信息可以利用$n的形式来获取并且用来做替换。由于其使用不是很多,就不在赘述。

四、正则表达式实例

经过上面对正则表达式基本语法的讲解及练习,我们来使用试着写几个正则表达式。

1. 英文名字校验,规则如下:

  • 名字: 标准的英文字母,1到10个字母组成,首字母大写

  • Middle Name简写:标准英文字母,1个字母,大小写都可以

  • 姓:标准的英文字母,可能有'(只能出现一个),比如: O’Brien,长度在2到10个字母,首字母大写
    根据上面的表格我们很容易写出这样的

       名字:`^[A-Z][a-z]{1,9}$`,其中^表示一行的开始[A-Z]表示第一个字母大写[a-z]表示中间的是小写字母,最后{1,9}表示1到9个字母,最后结尾是$
       MiddleName: `^[a-x]|[A-Z]$`,其中|表示或的意思
       姓:`^[A-Z]'?[a-z]{1,9}$`,其中'?表示'可以出现一次也可以不出现
    

2. 日期,规则如下:

日期应该在1/1/1900到31/12/2099年之间,并且日期的格式必须是dd/mm/yyyydd-mm-yyyy或者dd.mm.yyyy这三种格式:参考上面的速查表,我们可以写出如下的正则表达式来

    ^0[1-9]|([1-2]\d)|3[01][/-.]0[1-9]|[1][012][/-.](19|20)\d\d$

其中日期:0[1-9]|([1-2]\\d)|3[01],也就是穷举了所有的可能01,02,03...9,然后1或者2拼上\d,最后是3可能是30和31
月份:0[1-9]|[1][012],和前面的日期类似,并且更少了,大于10的之后10,11,12几种情况
年份:(19|20)\d\d前面是可能出现的年分19和20,后面就是任意0-9的组合
分隔符:[/-.]只可能出现这三种情况,所以用[]括起来即可

3. 日期加强版,规则如下:

格式是xx/xx/xx或xx.xx.xx或xx-xx-xx,分别是月,日,年,如:10-05-12表示12年10月5日,其中月分可以是英文全拼也可能是缩写,比如January->Jan,February->Feb,日期可能第几天,比如1st,2nd之类的,月日年之间可以有不定的几个空格,如March 13th, 2001:

     (\d{1,2}[-/.]\d{1,2}[-/.]\d{1,2})|(Jan(uary)?|Feb(ruary)?|Mar(ch)?|Apr(il)?|May|Jun(e)?|Jul(y)?|Aug(ust)?|Sep(tember)?|Oct(ober)?|Nov(ember)?|Dec(ember)?)\s*\d{1,2}(st|nd|rd|th)?+[,]\s*\d{4}

我们可以先用()将其切开,在用|将其切开
先看全是数字的:(\d{1,2}[-/.]\d{1,2}[-/.]\d{1,2})表示两个数字,两个数字的组合,如:10-05-12
然后看字母类型的(Jan(uary)?|Feb(ruary)?|Mar(ch)?|Apr(il)?|May|Jun(e)?|Jul(y)?|Aug(ust)?|Sep(tember)?|Oct(ober)?|Nov(ember)?|Dec(ember)?穷举了所有的月份信息,然后\s*表示任意多个空格,然后是日期\d{1,2}(st|nd|rd|th)?再加若干个空格:\s*最后是四位数字。

4. 时间,规则如下:

时间可以一位或者两位,数字,然后可以有若干个空格,最后是am或者pm,经过以上几个例子,我们不难写出:\d{1,2}\s*[ab]m这样的正则表达式

五、正则表达式在IOS中

一、NSRegularExpress

在IOS开发中,我们经常使用这个类来做有关文本校验筛选工作,对于对象的校验经常使用NSPredicate,其使用非常简单,主要包含创建,查找,替换几个方法:

    NSError *error = NULL;
    NSString *pattern = @"正则表达式";
    NSString *string = @"需要校验的文本";
    NSRange range = NSMakeRange(0, string.length);
    NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:pattern options:NSRegularExpressionCaseInsensitive error:&error]; // 创建RegularExpression对象
    NSArray *matches = [regex matchesInString:string options:NSMatchingProgress range:range]; // 找到校验的结果matches中是NSTextCheckingResult对象,该对象中包含各种被查找对象的信息
    
    // 下面两个方法还可以帮们替换掉找到的字符
    - (NSString *)stringByReplacingMatchesInString:(NSString *)string options:(NSMatchingOptions)options range:(NSRange)range withTemplate:(NSString *)templ;
   - (NSUInteger)replaceMatchesInString:(NSMutableString *)string options:(NSMatchingOptions)options range:(NSRange)range withTemplate:(NSString *)templ;

二、NSPredicate和正则表达式结合

NSString    *regularExpression = @"正则表达式";
NSPredicate *numberPre = [NSPredicate predicateWithFormat:@"SELF MATCHES %@",regularExpression];
return [numberPre evaluateWithObject:textString];

三、NSString的方法

-(NSRange)rangeOfString:(NSString *)aString options:(NSStringCompareOptions)mask;
NSRange range = [searchedText rangeOfString:@"正则表达式" options:NSRegularExpressionSearch];

六、常用的正则表达式

   1.验证用户名和密码:”^[a-zA-Z]\w{5,15}$”
  2.验证电话号码:(”^(\\d{3,4}-)\\d{7,8}$”)
  eg:021-68686868  0511-6868686;
  3.验证手机号码:”^1[3|4|5|7|8][0-9]\\d{8}$”;
  4.验证身份证号(15位或18位数字):”\\d{14}[[0-9],0-9xX]”;
  5.验证Email地址:(“^\\w+([-+.]\\w+)*@\\w+([-.]\\w+)*\.\\w+([-.]\\w+)*$”);
  6.只能输入由数字和26个英文字母组成的字符串:(“^[A-Za-z0-9]+$”) ;
  7.整数或者小数:^[0-9]+([.]{0,1}[0-9]+){0,1}$
  8.只能输入数字:”^[0-9]*$”。
  9.只能输入n位的数字:”^\\d{n}$”。
  10.只能输入至少n位的数字:”^\\d{n,}$”。
  11.只能输入m~n位的数字:”^\\d{m,n}$”。
  12.只能输入零和非零开头的数字:”^(0|[1-9][0-9]*)$”。
  13.只能输入有两位小数的正实数:”^[0-9]+(.[0-9]{2})?$”。
  14.只能输入有1~3位小数的正实数:”^[0-9]+(\.[0-9]{1,3})?$”。
  15.只能输入非零的正整数:”^\+?[1-9][0-9]*$”。
  16.只能输入非零的负整数:”^\-[1-9][]0-9″*$。
  17.只能输入长度为3的字符:”^.{3}$”。
  18.只能输入由26个英文字母组成的字符串:”^[A-Za-z]+$”。
  19.只能输入由26个大写英文字母组成的字符串:”^[A-Z]+$”。
  20.只能输入由26个小写英文字母组成的字符串:”^[a-z]+$”。
  21.验证是否含有^%&’,;=?$\”等字符:”[^%&',;=?$\x22]+”。
  22.只能输入汉字:”^[\u4e00-\u9fa5]{0,}$”。
  23.验证URL:”^http://([\\w-]+\.)+[\\w-]+(/[\\w-./?%&=]*)?$”。
  24.验证一年的12个月:”^(0?[1-9]|1[0-2])$”正确格式为:”01″~”09″和”10″~”12″。
  25.验证一个月的31天:”^((0?[1-9])|((1|2)[0-9])|30|31)$”正确格式为;”01″~”09″、”10″~”29″和“30”~“31”。
  26.获取日期正则表达式:\\d{4}[年|\-|\.]\\d{\1-\12}[月|\-|\.]\\d{\1-\31}日?
  评注:可用来匹配大多数年月日信息。
  27.匹配双字节字符(包括汉字在内):[^\x00-\xff]
  评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)
  28.匹配空白行的正则表达式:\n\s*\r
  评注:可以用来删除空白行
  29.匹配HTML标记的正则表达式:<(\S*?)[^>]*>.*?</>|<.*? />
  评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力
  30.匹配首尾空白字符的正则表达式:^\s*|\s*$
  评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式
  31.匹配网址URL的正则表达式:[a-zA-z]+://[^\s]*
  评注:网上流传的版本功能很有限,上面这个基本可以满足需求
  32.匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
  评注:表单验证时很实用
  33.匹配腾讯QQ号:[1-9][0-9]\{4,\}
  评注:腾讯QQ号从10 000 开始
  34.匹配中国邮政编码:[1-9]\\d{5}(?!\d)
  评注:中国邮政编码为6位数字
  35.匹配ip地址:((2[0-4]\\d|25[0-5]|[01]?\\d\\d?)\.){3}(2[0-4]\\d|25[0-5]|[01]?\\d\\d?)。

七、延伸阅读:

  1. https://www.raywenderlich.com/30288/nsregularexpression-tutorial-and-cheat-sheet
  2. http://www.regexpal.com/
  3. http://nshipster.com/nspredicate/
  4. http://nshipster.com/nssortdescriptor/
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,529评论 5 475
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,015评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,409评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,385评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,387评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,466评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,880评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,528评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,727评论 1 295
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,528评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,602评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,302评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,873评论 3 306
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,890评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,132评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,777评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,310评论 2 342

推荐阅读更多精彩内容