正则表达式

1、简介

在线检测:http://tool.oschina.net/regex/#  点击查看   或点击查看

正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符")。

正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。

正则表达式是繁琐的,但它是强大的,学会之后的应用会让你除了提高效率外,会给你带来绝对的成就感。

许多程序设计语言都支持利用正则表达式进行字符串操作。

举例:我们在写用户注册表单时,只允许用户名包含字符、数字、下划线和连接字符(-),并设置用户名的长度,我们就可以使用以下正则表达式来设定。

语言的支持

2、语法

3. 常用正则表达式

1. 匹配中文字符

正则表达式:[\u4e00-\u9fa5]

说明:目前主流计算机底层的编码系统都是Unicode,而在Unicode标准中,汉字表的第一个编码为U+4e00,最后一个编码为U+9fa5,所以[\u4e00-\u9fa5]就代表匹配任意一个Unicode编码表中存在的汉字。

2.匹配双字节字符

正则表达式:[^\x00-\xff]

说明:\x代表十六进制形式,2个字节长度的十六进制最大范围为00-ff,所以[^\x00-\xff]表示匹配长度为双字节的字符。

3. 匹配空白行

正则表达式:\n\s*\r

说明:这个表达式表示匹配内容中的空白行,比如一个txt由多行文字组成,并且句子与句子之间存在空白行,这个正则表达式便能加以区分。

首先,\n表示匹配一个换行符,而\s*代表匹配任意的空白符,\r表示匹配任意的回车符。

4. 匹配Email地址

[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?

5. 匹配URL

正则表达式:[a-zA-Z]+:\/\/[^\s]*

说明:[a-zA-Z]+表示匹配任意长度字符串,并且字符串包含的字符只能是a和z或者A和Z之间的字母。‘:\/\/’表示匹配“://”字符串。[^\s]*表示匹配任意长度的不包含非空字符的字符串。

当然了,日常生活中见到的网址URL大多以http或https开头,所以匹配以http或者https开发的网址也十分简单,笔者随手写了两个以供参考,比如 (http|https)://[^\s]*或者http[s]?://[^\s]*。

6. 匹配国内电话号码

正则表达式:\d{3}-\d{8}|\d{4}-\d{7,8}

说明:‘|’将匹配条件分为两部分。\d{3}-\d{8}代表匹配xxx-xxxxxxxx数字形式的号码。右边的\d{4}-\d{7,8}代表匹配xxxx-xxxxxxx或者xxxx-xxxxxxxx数字形式的号码。

示例:0577-12345678

7. 匹配腾讯qq号

正则表达式:[1-9][0-9]{4,}

说明:这个正则EXP十分容易理解,[1-9]表示匹配QQ号首位不为零的任意数字,[0-9]{4,}表示匹配从第二位开始最小长度为4的任意数字的字符串。

示例:1242450501

8. 匹配中国邮政编码

正则表达式:[1-9]\d{5}(?!\d)

说明:[1-9]表示匹配不为零的任意数字,(?!)表示零宽断言的一种语法,又称零宽度负预测先行断言,表示位置的后面不能匹配表达式,所以\d{5}(?!\d)表示匹配5位数字,而且这5位数字的后面不能是数字。

示例:325800,325800编码

9. 匹配18位身份证

正则表达式:^(\d{6})(\d{4})(\d{2})(\d{2})(\d{3})([0-9]|X)$

说明:这段正则虽然很长,其实表达的意思也非常简单。\d{6}代表匹配6位数字,\d{4}代表匹配4位数字,\d{2}代表匹配2位数字,\d{3}代表匹配3位数字,最后的[0-9]|X代表匹配0到9的任意数字,或者匹配X字母,正巧,笔者的身份证最后一位就是X。

示例: 65900719951006773X

10. 匹配正整数

正则表达式:^[1-9]\d*$

说明:^[1-9]表示首位匹配1到9的任意数字,\d*代表从第二位开始可以为空,不为空时必须为数字。由此正则推广开来,匹配负整数的表达式格式应该为 ^-[1-9]\d*$ 。

11. 匹配整数

正则表达式:^-?[1-9]\d*$

说明:后面的[1-9]\d*和匹配正整数的表达式一致,所以只要看懂-?代表整数的符号位可以有‘-’即可。

12. 匹配非负整数

正则表达式:^[1-9]\d*|0$

说明:[1-9]\d*和匹配正整数的表达式一致,|0表示可为0。同理,表示非正整数的表达式应该是 ^-[1-9]\d*|0$ 。

13. 匹配正浮点数

正则表达式:^[1-9]\d*\.\d*|0\.\d*[1-9]\d*$

说明:[1-9]\d*\.\d*代表匹配格式形如“正整数.数字”的字符串,0\.\d*[1-9]\d*$ 代表匹配格式形如“0.数字”的字符串。中间用|代表或条件。所以同理,匹配负浮点数的正则为^-[1-9]\d*\.\d*|-0\.\d*[1-9]\d*$。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容

  • 推荐几个正则表达式编辑器 Debuggex :https://www.debuggex.com/ PyRegex:...
    木易林1阅读 11,423评论 9 151
  • 几个正则表达式编辑器 Debuggex :https://www.debuggex.com/ PyRegex:ht...
    没技术的BUG开发攻城狮阅读 4,575评论 0 23
  • 初衷:看了很多视频、文章,最后却通通忘记了,别人的知识依旧是别人的,自己却什么都没获得。此系列文章旨在加深自己的印...
    DCbryant阅读 3,967评论 0 20
  • 正则表达式到底是什么东西?字符是计算机软件处理文字时最基本的单位,可能是字母,数字,标点符号,空格,换行符,汉字等...
    狮子挽歌阅读 2,129评论 0 9
  • python的re模块--细说正则表达式 可能是东半球最详细最全面的re教程,翻译自官方文档,因为官方文档写的是真...
    立而人阅读 22,784评论 4 46