简单讲讲关于正则表达式的入门

大家好,我是IT修真院深圳分院的学员,一枚正直纯洁善良的JAVA程序员。本次为大家带来关于正则表达式的入门。

1.背景介绍

关于历史

正则表达式一开始是研究人类神经系统工作原理的专家提出的概念,后来正则表达式被引入到计算搜索算法的早期研究中,然后又经过程序圈几十年的发展与迭代,到现在正则表达式已经成为程序语言中不可分割的一部分。如果你是一位接触计算机语言的工作者,那么你会在主流操作系统(*nix[Linux,Unix等]、Windows、HP、BeOS等)、主流的开发语言(delphi、Scala、PHP、C#、Java、C++、Objective-c、Swift、VB、Javascript、Ruby以及Python等)、数以亿万计的各种应用软件中,都可以看到正则表达式优美的舞姿。我们甚至可以说,现在几乎所有的编程语言都支持正则表达式,只是因为语言的不同而略有差异。

关于正则表达式

正则表达式(Regular Expression,在代码中常简写为regex、regexp或RE).

正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

通俗的讲就是按照某种规则去匹配符合条件的字符串,而正则表达式定义的就是匹配规则。

2.知识剖析


元字符

(* + ? $ ^ . | \ ( ) { } [ ])

字符类

\w 匹配任何单字符 [a-zA-Z0-9]

\W 匹配任何单字符以外的字符

\d 匹配任何单数字[0-9]

\D 匹配所有数字之外的字符

\s 匹配任何Unicode空白符

\S 匹配任何Unicode空白符之外的字符

[...] 匹配任何方括号之内的字符

[^...] 匹配任何方括号之外的字符

修饰符

1、g:global全文搜索,不添加,搜索到第一个匹配停止;

2、i:ignore case忽略大小写,默认大小写敏感;

3、m:multiple lines多行搜索。

重复:量词

?:出现零次或一次(最多出现一次);

+:出现一次或多次(至少出现一次);

*:出现零次或多次(任意次);

{n}:出现n次;

{n,m}:出现n到m次;

{n,}:至少出现n次。

反义 :[^]

分组:使用()可以达到分组的功能,使用量词作用于分组

字符转义:使用\可以达到字符转义的功能

分枝条件:使用|可以达到分支的功能,约等于java里面的或者

贪婪与懒惰:在量词后面加上?会变成非贪婪模式.

后向引用

零宽断言

负向零宽断言

处理选项

平衡组/递归匹配

关于正则表达式引擎

正则引擎主要可以分为两大类:一种是DFA,一种是NFA。这两种引擎都有了很久的历史(至今二十多年),当中也由这两种引擎产生了很多变体!于是POSIX的出台规避了不必要变体的继续产生。这样一来,主流的正则引擎又分为3类:一、DFA,二、传统型NFA,三、POSIX NFA。

3.常见问题

1.读不懂正则表达式怎么办?

 2.正则表达式在java中如何运用。


4.解决方案

1.读不懂正则表达式怎么办?正则表达式可视化工具:http://regexper.com

正则表达式可视化工具:http://regexper.com

一般来说,正则表达式只是用来写的,基本上写完,完成预期的功能后,作者就已经不知道该怎么读自己写的正则表达式了。

2.正则表达式在java中如何运用。

java.util.regex 包主要包括以下三个类:

Pattern 类:

pattern 对象是一个正则表达式的编译表示。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态编译方法,它返回一个 Pattern对象。该方法接受一个正则表达式作为它的第一个参数。

Matcher 类:

Matcher 对象是对输入字符串进行解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher对象。

PatternSyntaxException:

PatternSyntaxException 是一个非强制异常类,它表示一个正则表达式模式中的语法错误。

5.编码实战

6.扩展思考

正则表达式这么强,我们应该怎么用?

上帝的归上帝,正则的归正则,分工明确。

7.参考文献

链接:http://deerchao.net/tutorials/regex/regex.htm

作者:deerchao

链接:https://juejin.im/post/582dfcfda22b9d006b726d11

作者:水墨寒湘

8.更多讨论

1.正则表达式在linux的shell脚本中有哪些命令可以使用?

sed命令.awk命令和grep命令都可以使用正则表达式。

2.怎么是用这个东西显示的,什么网页?

关于正则表达式的可视化工具:https://regexper.com/。这个网站是可以安装到本地的,由GitHub管理源码。

3.使用正则判断输入的邮箱符合格式是否正确。

\\w+([+.-]\\w+)*@\\w+([.-]\\w+)*\\[^\n\r\x85\u2028\u2029]\\w+([.-]\\w+)*

PPT链接:戳这里看PPT

腾讯视频:腾讯视频

技能树.IT修真院

“我们相信人人都可以成为一个工程师,现在开始,找个师兄,带你入门,掌控自己学习的节奏,学习的路上不再迷茫”。

这里是技能树.IT修真院,成千上万的师兄在这里找到了自己的学习路线,学习透明化,成长可见化,师兄1对1免费指导。快来与我一起学习吧

直接点击此链接:http://www.jnshu.com/login/1/10985551

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,319评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,801评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,567评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,156评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,019评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,090评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,500评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,192评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,474评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,566评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,338评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,212评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,572评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,890评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,169评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,478评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,661评论 2 335

推荐阅读更多精彩内容

  • Java的正则表达式讲解:(为了能看清,本文正则表达式用中文的句号代替英文句点) 英文句点符号:匹配单个任意字符。...
    红姑娘阅读 4,271评论 0 2
  • 1.正则表达式介绍 正则表达式算起来也是一个很庞大的语言系统,在所有的开发语言中基本都支持正则表达式,它可以很方便...
    babybus_superdo阅读 2,557评论 3 6
  • 简介 正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为"元字符")组成的文字模式。模式描述在搜索文...
    我为峰2014阅读 482评论 0 2
  • 原文地址 之前在http://shukuiyan.iteye.com/blog/507915文中已经叙述过这个问题...
    hmaccelerate阅读 819评论 0 1
  • 主人公是一位典型的LOSER,他父亲做生意失利导致家庭破产,他自己的事业也走下坡路,被公司降职,女朋友跟他分手,又...
    陇西读书与写作阅读 748评论 1 14