java正则表达式使用

简介

对于一些文本操作,正则表达式提供了强有力的辅助,它允许我们通过带有描述性性质的描述语言,得到我们需要的文本数据。

java正则表达式功能类简介

对于java而言,其在java.util.regex包中给我们提供了正则表达式功能,该包结构如下图所示:

java.util.regex

可以看到,regex包下包含一个接口MatchResult,两个类Pattern,Matcher,以及一个异常类PatternSyntaxException
其中:
MatchResult:代表匹配操作的结果,该接口提供了查询方法用来检测匹配器匹配正则表达式的结果。通过MatchResult,可以查看匹配边界,匹配组合以及组边界,但是不能进行修改。

Pattern:正则表达式的编译表现形式。指定为正则表达式的字符串必须首先被编译成此类的实例,然后,可将得到的模式用于创建Matcher对象,依照正则表达式,该对象可与任意字符序列匹配。执行匹配所涉及的所有状态都驻留在匹配器中,所以多个匹配器可以共享同一模式。

Matcher:执行由Pattern解释的字符串序列操作引擎。Matcher实现了MatchResult

PatternSyntaxException:当正则表达式解析出错时抛出该异常。

通配符简介

java正则表达式的全部通配符介绍可以在官网API中查看,下面主要介绍其中一些比较常用的:

字符类
[abc] 匹配a或者b或者c
[^abc] 除了a,b,c以外的字符都匹配
[a-zA-Z] a-z,A-Z任意一个字符都匹配
[a-d[m-p]] a-d或者m-p中任意一个字符都匹配
[a-z&&[def]] 同时满足a-z和d,e,f中的一个则匹配(并集)
[a-z&&[^bc]] a-z任意一个字符都匹配,除了b和c
ab|cd 或匹配器,匹配 ab 或 cd
预定义字符类
. 任意字符 (与<u>行结束符</u>可能匹配,也可能不匹配)
\d 数字 [0-9]
\D 非数字 [^0-9]
\s 空白字符 [ \t\n\x0B\f\r]
\S 非空白字符 [^\s]
\w 字符类型 [a-zA-Z_0-9]
\W 非字符类型 [^\w]
边界匹配器
^ 行开头
$ 行结尾
\b 单词边界
\B 非单词边界
Greedy 数量词
X? X,一次或一次也没有
X* X,零次或多次
X+ X,一次或多次
X{n} X,恰好n次
X{n,} X,至少n次
X{n,m} X,至少n次,但不超过m次

例子

正则表达式对文本的操作总结起来为:匹配,切割,替换,获取。

  • 匹配
    判断给定字符串是否符合QQ号码格式。
    (QQ号码格式规范:
    1.全部为数字
    2.起码6位数字以上,不超过15位数;
    3.第一个数字不能为0;)
    String str = "23453463456";
    Pattern pattern = Pattern.compile("[1-9]\\d{5,15}");
    Matcher matcher = pattern.matcher(str);
    boolean bMatch = matcher.matches();
    System.out.println("match="+bMatch);
  • 切割
    对给定字符串,按空格进行切割。
    String str="first   second   third  ";
    Pattern pattern = Pattern.compile("\\s+");//或者“ ”+
    String[] splits = pattern.split(str);
    for(int i = 0 ; i < splits.length ; ++i){
        System.out.println("splits["+i+"]="+splits[i]);
    }
  • 替换
    对给定字符串,按叠词进行替换,将叠词数量保留一位。
    String str="abb3dadadfa333aaaaaaaa";
    Pattern pattern = Pattern.compile("(.)\\1+");
    Matcher matcher = pattern.matcher(str);
    String replaceStr = matcher.replaceAll("$1");
    System.out.println("replaceStr="+replaceStr);

注: 此处使用了组概念,用符号()表示一个组,正则表达式"(.)\1+"表达的意思是:任意字符,\1表示引用第一组的结果,也就是(.)的字符,所以这句话的意思就是第一个字符是任意字符,后面一个字符跟前一个一致,有一个或一个以上。
“$1"表示引用第一个组的内容。

  • 获取
    对给定字符串,取出大括号{}内的字符串。
    String str = "users/{user}/repos/{page}/";
    Pattern pattern = Pattern.compile("\\{([a-zA-Z][a-zA-Z0-9_-]*)\\}");
    Matcher matcher = pattern.matcher(str);
    while(matcher.find()){
        String findstr = matcher.group();
        System.out.println("findstr="+findstr);
    }

最后,网上有很多可以直接对正则进行验证的在线工具,大家可以去找找看。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,033评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,725评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,473评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,846评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,848评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,691评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,053评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,700评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,856评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,676评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,787评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,430评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,034评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,990评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,218评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,174评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,526评论 2 343

推荐阅读更多精彩内容

  • 初衷:看了很多视频、文章,最后却通通忘记了,别人的知识依旧是别人的,自己却什么都没获得。此系列文章旨在加深自己的印...
    DCbryant阅读 3,981评论 0 20
  • 前言 对于正则,著称火星文字,见名知意主要它晦涩难懂,一直以来,看到它总是怕怕的,在平时,也只是简单的用用,其主要...
    itclanCoder阅读 757评论 0 2
  • 没想到前几日的文章还会有评论,真是让我受宠若惊。但是原谅我不再一一回复了。 今天和大长腿小姐讲到张爱玲,我几乎已经...
    独木Atree阅读 477评论 0 5
  • 有大半年没上过菜市场,新近搬了家,头等大事当然是寻访附近的菜市场。从一个隐蔽的入口进去,没来得及赞叹社区规划的高明...
    微冷微冷阅读 13,044评论 5 11
  • 进了小公司的应届程序员如何翻身进入大公司——知乎上的一个问题,有近 4700 人关注,130 多万次浏览,我的回...
    安晓辉0阅读 3,576评论 10 60