OC-正则表达式-(第一篇)

一、正则表达式基本概念

1.什么是正则表达式 正则表达式,又称正规表示法,是对字符串操作的一种逻辑公式。 正则表达式可以检测 给定的字符串是否符合我们定义的逻辑,也可以从字符串中获取我们想要的特定部分。它可以 迅速地用极简单的方式达到字符串的复杂控制。

2.什么是谓词 Cocoa框架中的NSPredicate用于查询,原理和用法都类似于SQL中的where,作用相当于数据库的过滤取。 我们可以编写简单的谓词语句,就可以从数组中过滤出我们想要的数据。

二.正则表达式的使用
//正则表达式的使用

(void)useRegularExpressions
{
** #pragma mark 1.正则表达式规则**** **
/-------------------------------1.1普通字符-------------------------------/
// 字母、数字、汉字、下划线、非特殊定义的标点符号,都是"普通字符"。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。

NSString *searchString1_1 = @"abcde";
NSString *regexString1_1 = @"c";
NSString *matchedString1_1 = [searchString1_1 stringByMatching:regexString1_1];
NSLog(@"matchedString1_1:%@",matchedString1_1); // 输出结果: c

/-------------------------------1.2简单的转义字符-------------------------------/
// 一些不便书写的字符,在前面加 "",如:\n,\t,\ 等

NSString *searchString1_2 = @"abc$de";
// 记住在字符串中“\”需要用“\”表示
NSString *regexString1_2 = @"$d";
NSString *matchedString1_2 = [searchString1_2 stringByMatching:regexString1_2];
NSLog(@"matchedString1_2:%@",matchedString1_2); // 输出结果: $d

/------------------------1.3能够与 '多种字符' 匹配的表达式-------------------------/
/*
. : 匹配除换行符以外的任意字符

\w : 匹配字母或数字或下划线或汉字

\s : 匹配任意的空白符

\d : 匹配数字

\b : 匹配单词的开始或结束
*/
NSString *searchString1_3 = @"abc123";
// 正则表达式有一条规则:最先开始的匹配拥有最高的优先权
NSString *regexString1_3 = @"\d\d";
NSString *matchedString1_3 = [searchString1_3 stringByMatching:regexString1_3];
NSLog(@"matchedString1_3:%@",matchedString1_3); // 输出结果: 12

/---------------------1.4自定义能够匹配 '多种字符' 的表达式-------------------------/
// 使用方括号 [ ] 包含一系列字符,能够匹配其中任意一个字符。用 [^ ] 包含一系列字符,则能够匹配其中字符之外的任意一个字符。同样的道理,虽然可以匹配其中任意一个,但是只能是一个,不是多个。[]本身就隐含了“或”的关系,在[]中使用“|”表示“或”的关系是不对的,这样做只是多了一个普通字符“|”,用来匹配“|”字符本身,()也是同样道理。 如:

/*
[ab5@] : 匹配 "a" 或 "b" 或 "5" 或 "@"

[^abc] : 匹配 "a","b","c" 之外的任意一个字符

[f-k] : 匹配 "f"~"k" 之间的任意一个字母

[^A-F0-3] : 匹配 "A""F","0""3" 之外的任意一个字符
*/
NSString *searchString1_4 = @"abc123";
NSString *regexString1_4 = @"[bcd][bcd]";
NSString *matchedString1_4 = [searchString1_4 stringByMatching:regexString1_4];
NSLog(@"matchedString1_4:%@",matchedString1_4); // 输出结果: bc

/---------------------1.5修饰匹配次数的特殊符号------------------------------/
// 使用表达式再加上修饰匹配次数的特殊符号,那么不用重复书写表达式就可以重复匹配

/*
{n} : 表达式重复n次

{m,n} :  表达式至少重复m次,最多重复n次

{m,}  :  表达式至少重复m次

?     :  匹配表达式0次或者1次,相当于 {0,1}

+     :  表达式至少出现1次,相当于 {1,}

*     :  表达式不出现或出现任意次,相当于 {0,}

*/
NSString *searchString1_5 = @"It costs $12.5";
NSString *regexString1_5 = @"\d+\.?\d";
NSString *matchedString1_5 = [searchString1_5 stringByMatching:regexString1_5];
NSLog(@"matchedString1_5:%@",matchedString1_5); // 输出结果: 12.5

/---------------------1.6其他一些代表抽象意义的特殊符号--------------------------/
// 一些符号在表达式中代表抽象的特殊意义

/*
^ : 与字符串开始的地方匹配,不匹配任何字符

$     : 与字符串结束的地方匹配,不匹配任何字符

\b    : 匹配一个单词边界,也就是单词和空格之间的位置,不匹配任何字符

*/
// 进一步说明:"\b" 与 "^" 和 "$" 类似,本身不匹配任何字符,但是它要求它在匹配结果中所处位置的左右两边,其中一边是 "\w" 范围,另一边是 非"\w" 的范围
NSString *searchString1_6 = @"@@@abc";
NSString *regexString1_6 = @".\b.";
NSString *matchedString1_6 = [searchString1_6 stringByMatching:regexString1_6];
NSLog(@"matchedString1_6:%@",matchedString1_6); // 输出结果: @a
pragma mark 2.正则表达式中的一些高级规则

/---------------------2.1匹配次数中的贪婪与非贪婪--------------------------/
// 1)在使用修饰匹配次数的特殊符号"{m,n}", "{m,}", "?", "*", "+"可以使同一个表达式能够匹配不同的次数,这种重复匹配不定次数的表达式在匹配过程中,总是尽可能多的匹配。如:
NSString *searchString2_1_1 = @"dxxxdxxxd";
NSString *regexString2_1_1 = @"(d)(\w+)(d)";
NSString *matchedString2_1_1 = [searchString2_1_1 stringByMatching:regexString2_1_1];
NSLog(@"matchedString2_1_1:%@",matchedString2_1_1); // 输出结果: dxxxdxxxd

// 2)在修饰匹配次数的特殊符号后再加上一个 "?" 号,则可以使匹配次数不定的表达式尽可能少的匹配,这种匹配原则叫作 "非贪婪" 模式,也叫作 "勉强" 模式
NSString *regexString2_1_2 = @"(d)(\w+?)(d)";
NSString *matchedString2_1_2 = [searchString2_1_1 stringByMatching:regexString2_1_2];
NSLog(@"matchedString2_1_2:%@",matchedString2_1_2); // 输出结果: dxxxd

/---------------------2.2反向引用--------------------------------------/
// 使用小括号指定一个子表达式后,匹配这个子表达式的文本(也就是此分组捕获的内容)可以在表达式或其它程序中作进一步的处理。默认情况下,每个分组会自动拥有一个组号,规则是:从左向右,以分组的左括号为标志,第一个出现的分组的组号为1,第二个为2,以此类推
NSString *searchString2_2 = @"Go go";
NSString *regexString2_2 = @"\b(\w+)\b\s+\1\b";
NSString *matchedString2_2 = [searchString2_2 stringByMatching:regexString2_2];
NSLog(@"matchedString2_2:%@",matchedString2_2); // 输出结果: go go

/----------------2.3零宽断言-------------------------------------------/
// 零宽断言用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像\b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言
/*

1)捕获
(exp) : 匹配exp,并捕获文本到自动命名的组里
(?<name>exp) : 匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp)
(?:exp) : 匹配exp,不捕获匹配的文本,也不给此分组分配组号零宽断言,可节约性能,提高效率

2)零宽断言
(?=exp) : 匹配exp前面的位置
(?<=exp) : 匹配exp后面的位置
(?!exp) : 匹配后面跟的不是exp的位置
(?<!exp) : 匹配前面不是exp的位置注释(?#comment)这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读

*/
NSString *searchString2_3 = @"I'm singing while you're dancing.";
NSString *regexString2_3 = @"\b\w+(?=ing\b)";
NSArray *matchedString2_3 = [searchString2_3 componentsMatchedByRegex:regexString2_3];
NSLog(@"matchedString2_3:%@",matchedString2_3); // 输出结果: (sing,danc)

// 3.其他通用规则
/----------------3.1------------------------------------------/
// 表达式中,可以使用 "\xXX" 和 "\uXXXX" 表示一个字符("X" 表示一个十六进制数)
/*

\xXX    : 编号在 0 ~ 255 范围的字符,比如:空格可以使用 "\x20" 表示

\uXXXX  : 任何字符可以使用 "\u" 再加上其编号的4位十六进制数表示,比如:"\u4E2D"

*/

/----------------3.2------------------------------------------/
// 在表达式 "\s","\d","\w","\b" 表示特殊意义的同时,对应的大写字母表示相反的意义
/*

\S     : 匹配所有非空白字符("\s" 可匹配各个空白字符)

\D     : 匹配所有的非数字字符

\W     : 匹配所有的字母、数字、下划线以外的字符

\B     : 匹配非单词边界,即左右两边都是 "\w" 范围或者左右两边都不是 "\w" 范围时的字符缝隙

*/

/----------------3.3------------------------------------------/
// 在表达式中有特殊意义,需要添加 "" 才能匹配该字符本身的字符汇总
/*

^     : 匹配输入字符串的开始位置。要匹配 "^" 字符本身,请使用 "\^"

$     : 匹配输入字符串的结尾位置。要匹配 "$" 字符本身,请使用 "\$"

( )   : 标记一个子表达式的开始和结束位置。要匹配小括号,请使用 ""和"

"

[ ]   : 用来自定义能够匹配 '多种字符' 的表达式。要匹配中括号,请使用 ""和"

"

{ }   : 修饰匹配次数的符号。要匹配大括号,请使用 "\{" 和 "\}"

.     : 匹配除了换行符(\n)以外的任意一个字符。要匹配小数点本身,请使用 "\."

?     : 修饰匹配次数为 0 次或 1 次。要匹配 "?" 字符本身,请使用 "\?"

+     : 修饰匹配次数为至少 1 次。要匹配 "+" 字符本身,请使用 "\+"

*     : 修饰匹配次数为 0 次或任意次。要匹配 "*" 字符本身,请使用 "\*"

|     : 左右两边表达式之间 "或" 关系。匹配 "|" 本身,请使用 "\|"

"     : 用在不带@的字符串中时,用\"来进行转义,用在带@的字符串中时,用""来进行转义

** 注意:大部分在正则中有特殊意义、在匹配其本身时需转义的字符,在[]内是不需要转义的。必须转义的只有“\”、“[”和“]”,而“”出现在[]开始位置,“-”前后构成范围区间时,需要转义,出现在其它位置不需要转义,如:[ .$^{[(|)+?-]*

*/
}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容