正则表达式

文章作者:Tyan
博客:noahsnail.com  |  CSDN  |  简书

1. 正则表达式

正则表达式(Regular Expression)描述了一种字符串匹配模式,主要用来检索、替换匹配某种模式的字符串。

2. 正则表达式语法

下面以Python代码来展示正则表达式的匹配。

  • .
    .可以匹配任意单个字符,除了换行符。例如.可匹配abc中的任意一个字符。
import re
print(re.findall(r'.', 'abc'))

# 代码执行结果
['a', 'b', 'c']
  • ^
    ^表示字符串的开始,例:^Th表示匹配以Th开头的字符串。
import re
print(re.findall(r'^Th', 'This is a demo. This is a demo.'))

# 代码执行结果
['Th']
  • $
    $表示字符串的结束,例:demo$表示匹配以demo结尾的字符串。
import re
print(re.findall(r'demo$', 'This is a demo. This is a demo'))

# 代码执行结果
['demo']
  • *
    *匹配>=0个在*号之前的字符。例:test*表示匹配以tes为起始值,其后为0个t或多个t的字符串。
import re
print(re.findall(r'test*', 't te tes test testt'))

# 代码执行结果
['tes', 'test', 'testt']
  • +
    +匹配>=1个在+号之前的字符。例:test+表示匹配以tes为起始值,其后为1个t或多个t的字符串。
import re
print(re.findall(r'test+', 't te tes test testt'))

# 代码执行结果
['test', 'testt']
  • ?
    ?之前的字符为可选字符。例:test?表示匹配以tes为起始值,其后为1个t或没有t的字符串。
import re
print(re.findall(r'test?', 't te tes test testt'))

# 代码执行结果
['tes', 'test', 'test']
  • \
    \为转义字符,用于匹配一些保留的字符[ ] ( ) { } . * + ? ^ $ \ |
import re
print(re.findall(r'test\?', 't te tes test? testt'))

# 代码执行结果
['test?']
  • |
    |为或运算符,匹配符号前或后的字符。例:te|st表示匹配test的字符串。
import re
print(re.findall(r'te|st', 't te tes test'))

# 代码执行结果
['te', 'te', 'te', 'st']
  • [ ]
    [ ]表示要匹配的字符种类,匹配方括号内的任意字符。例:[test]匹配括号中的任意一个字符。
import re
print(re.findall(r'[test]', 'This is a test'))

# 代码执行结果
['s', 's', 't', 'e', 's', 't']
  • [^ ]
    [^ ]表示不进行匹配的字符种类,匹配除了方括号里字符之外的任意字符。
import re
print(re.findall(r'[^test]', 'This is a test'))

# 代码执行结果
['T', 'h', 'i', ' ', 'i', ' ', 'a', ' ']
  • {m,n}
    {m,n}表示匹配(n-m+1)个大括号之前的字符。例:test{1,2}表示匹配以tes为起始值,其后为1-2t的字符串。
import re
print(re.findall(r'test{1,2}', 'This is a test testt'))

# 代码执行结果
['test', 'testt']
  • (xyz)
    (xyz)表示匹配与()内容完全相同的字符串。例:(test){1,2}表示匹配1-2testtest是一个整体。
import re
print(re.findall(r'(test){1,2}', 'This is a test testt'))

# 代码执行结果
['test', 'test']
  • \w
    \w匹配所有字母数字以及下划线,即[a-zA-z0-9_]
import re
print(re.findall(r'\w', 'Is this a test?_'))

# 代码执行结果
['I', 's', 't', 'h', 'i', 's', 'a', 't', 'e', 's', 't']
  • \W
    \W匹配字母数字以及下划线之外的字符,即[^\w]
import re
print(re.findall(r'\W', 'Is this a test?'))

# 代码执行结果
[' ', ' ', ' ', '?']
  • \d
    \d匹配数字,即[0-9]
import re
print(re.findall(r'\d', 'test 123'))

# 代码执行结果
['1', '2', '3']
  • \D
    \D匹配数字之外的字符,即[^\d]
import re
print(re.findall(r'\D', 'test 123'))

# 代码执行结果
['t', 'e', 's', 't', ' ']
  • \s
    \s匹配所有空格字符,即[\t\n\f\r\p{Z}]
import re
print(re.findall(r'\s', 'test 123\n'))

# 代码执行结果
[' ', '\n']
  • \S
    \S匹配非空格字符,即[^\s]
import re
print(re.findall(r'\S', 'test 123\n'))

# 代码执行结果
['t', 'e', 's', 't', '1', '2', '3']
  • \n
    \n匹配一个换行符。
import re
print(re.findall(r'\n', 'test 123\n'))

# 代码执行结果
['\n']
  • \f
    \f匹配一个换页符。
import re
print(re.findall(r'\f', 'test 123\f'))

# 代码执行结果
['\x0c']
  • \r
    \r匹配一个回车符。
import re
print(re.findall(r'\r', 'test 123\r'))

# 代码执行结果
['\r']
  • \t
    \t匹配一个制表符。
import re
print(re.findall(r'\t', 'test 123\t'))

# 代码执行结果
['\t']
  • \v
    \v匹配一个垂直制表符。
import re
print(re.findall(r'\v', 'test 123\v'))

# 代码执行结果
['\x0b']
  • ?=
    ?=是前置约束,表示要匹配的是?=之前的内容,但同时要匹配?=之后的内容,前置约束需要使用()。例:Th(?=is)表示要匹配Th,要找的是This中的Th
import re
print(re.findall(r'Th(?=is)', 'There or This or The?'))

# 代码执行结果,匹配的是This中的Th
['Th']
  • ?!
    ?!也是前置约束,但与?=正好相反,也是要匹配?!之前的内容,但同时要不匹配?!之后的内容,前置约束需要使用()。例:Th(?!is)表示要匹配Th,要找的是非This中的Th
import re
print(re.findall(r'Th(?!is)', 'There or This or The?'))

# 代码执行结果,匹配的是There, The中的Th
['Th', 'Th']
  • ?<=
    ?<=是后置约束,表示要匹配的是(?<=)之后的内容,但同时要匹配(?<=)括号内的内容,后置约束需要使用()。例:(?<=H)e表示要匹配e,要找的是He中的e
import re
print(re.findall(r'(?<=H)e', 'The or He or She?'))

# 代码执行结果,匹配的是He中的e
['e']
  • ?<!
    ?<!是后置约束,表示要匹配的是(?<!)之后的内容,但同时要不匹配(?<!)括号内的内容,后置约束需要使用()。例:(?<!H)e表示要匹配e,要找的是非He中的e
import re
print(re.findall(r'(?<!H)e', 'The or He or She?'))

# 代码执行结果,匹配的是The, She中的e
['e', 'e']

参考资料

  1. https://juejin.im/entry/59a651116fb9a024844938b5
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容