【读书笔记】_正则表达式

1、正则表达式使用的特殊符号和字符

1.1、用管道符号( | )匹配多个正则表达式模式,即或,匹配多个表达式。

例:at|home 匹配at,home

1.2、匹配任意一个单个的字符( . ),但是除了换行符。如果要匹配.号本身,那需要转义字符,即\..net,匹配.net

例:A.B 匹配ACB,A1B,A+B

1.3、从字符串的开头或结尾或单词边界开始匹配( ^,/$ ,/\b, /\B )

例:正则表达式模式 匹配的字符串

^From :匹配任何以 From 开始的字符串

/bin/tcsh$ :匹配任何以 /bin/tcsh 结束的字符串

^Subject: hi$: 匹配仅由 Subject: hi 组成的字符串

\bthe: 任何以"the"开始的字符串

\Bthe 任意包含“the”但不以“the”开头的单词

1.3.1、“matching”是试图从整个字符串的开头进行匹配,而 “searching” 则可从一个字符串的任意位置开始匹配

1.4、创建字符类( [ ] ),使用方括号的正则表达式会匹配方括号里的任何一个字符

例:b[aeiu]t :bat, bet, bit, but

[cr][23][dp][o2] :一个包含 4 个字符的字符串: 第一个字符是“r” 或“c”, 后面是“2”或 “3”,再接下来是 “d” 或 “p”,最后是 “o” 或 “2“

1.5、指定范围 ( - ) 和 否定( ^ ),方括号里一对符号中间的连字符(-)用来表示一个字符的范围;如果在左方括号后第一个字符是上箭头符号(^),就表示不匹配指定字符集里的任意字符。

例:z.[0-9] :字符"z",后面跟任意一个字符,然后是一个十进制数字,如za2

[^ab]: 除a,b之外的任意一个字符。

1.6、使用闭包操作符 ( *, +, ?, {} ) 实现多次出现/重复匹配

1.6.1、星号或称星号操作符匹配它左边那个正则表达式出现零次或零次以上的情况

1.6.2、加号(+)操作符匹配它左边那个正则表达式模式至少出现一次的情况

1.6.3、问号操作符( ? )匹配它左边那个正则表达式模式出现零次或一次的情况

1.6.4、花括号操作符({ }),如,{N},则表示匹配 N 次出现;如果是一对值,即,{M, N},就表示匹配 M 次到 N 次出现

举例:[dn]ot? :字符"d"或"o", 后面是一个"o", 最后是最多一个字符"t", 即, do, no, dot,not

[0-9]{15,16} :15 或 16 位0到9的数字表示,例如:信用卡号码

1.7、特殊字符表示字符集

1.7.1、“0–9”这个范围表示十进制数字,而改用简写“\d”表示;

1.7.2、“\w” 可用来表示整个 字符数字的字符集,即相当于“A-Za-z0-9_”的简写形式;

1.7.3、特殊字符“\s” 代表空白字符。

2、re 模块: 核心函数和方法

re模块集合

2.1、匹配对象 和 group(), groups() 方法

group()方法或者返回所有匹配对象或是根据要求返回某个特定子组。groups()则很简单,它返回一个包含唯一或所有子组的元组。如果正则表达式中没有子组的话, groups() 将返回一个空元组,而 group()仍会返回全部匹配对象。

2.2、用 match()匹配字符串

re.match()函数尝试从字符串的开头开始对模式进行匹配。如果匹配成功,就返回一个匹配对象,而如果匹配失败了,就返回 None

m = re.match('foo', 'foo')

if m is not None:

    m.group()  --->'foo'

2.3、search() 在一个字符串中查找一个模式

>>m = re.match('foo', 'seafood') # no match 匹配失败

>>m = re.search('foo', 'seafood') 匹配到了‘foo’

2.4、匹配多个字符串( | )

bt = 'bat|bet|bit'

>>m = re.match(bt, 'bat') #匹配失败

>>m = re.search(bt, 'He bit me!') #匹配成功

2.5、用 findall()找到每个出现的匹配部分

findall()总返回一个列表。如果 findall()没有找到匹配的部分,会返回空列表;如果成功找到匹配部分,则返回所有匹配部分的列表(按从左到右出现的顺序排列)

正则表达式仅有一个子组时,findall()返回子组匹配的字符串组成的列表;如果表达式有多个子组,返回的结果是一个元组的列表,元组中每个元素都是一个子组的匹配内容

>>re.findall('car', 'carry the barcardi to the car')

['car', 'car', 'car']

2.6、用 split()分割(分隔模式)

re 模块和正则表达式对象的方法 split()与字符串的 split()方法相似, 前者是根据正则表达式模式分隔字符串,后者是根据固定的字符串分割,

>>> re.split(':', 'str1:str2:str3')

['str1', 'str2', 'str3']

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,711评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,932评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,770评论 0 330
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,799评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,697评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,069评论 1 276
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,535评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,200评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,353评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,290评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,331评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,020评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,610评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,694评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,927评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,330评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,904评论 2 341

推荐阅读更多精彩内容