Java中Pattern.compile函数的使用详解

 更新时间:2021年08月16日 09:09:48   作者:Code0cean  
这篇文章主要介绍了Java中Pattern.compile函数的使用详解,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

Java Pattern.compile函数的使用

除了Pattern Pattern.compile(String regex),

Pattern类的compile()方法还有另一个版本:

Pattern Pattern.complie(String regex,int flag),它接受一个标记参数flag,以调整匹配的行为。

flag来自以下Pattern类中的常量:

编译标记 效果
Pattern.CANON_EQ 两个字符当且仅当它们的完全规范分解相匹配时,就认为它们是匹配的,例如,如果我们指定这个标记,表达式a\u030A就会匹配字符串?。在默认的情况下,匹配不考虑规范的等价性
Pattern.CASE_INSENSITIVE(?i) 默认情况下,大小写不敏感的匹配假定只有US-ASCII字符集中的字符才能进行。这个标记允许模式匹配不必考虑大小写(大写或小写)。通过指定UNICODE_CASE标记及结合此标记,基于Unicode的大小写不敏感的匹配就可以开启了,也可以使用嵌入的标记表达式?i开启,下同
Pattern.COMMENTS(?x) 在这种模式下,表达式中的空格(不是指\s,单纯指空格)将被忽略掉,并且以#开始直到行末的注释也会被忽略掉。通过嵌入的标记表达式也可以开启Unix的行模式
Pattern.DOTALL(?s) 在dotall模式中,表达式“.”匹配所有字符,包括行终结符。默认情况下,“.”表达式不匹配行终结符
Pattern.MULTLINE(?m) 在多行模式下,表达式^和$分别匹配一行或输入字符串的开始和结束。默认情况下,这些表达式仅匹配输入的完整字符串的开始和结束
Pattern.UNICODE_CASE(?u) 当指定这个标记,并且开启CASE_INSENSITIVE时,大小写不敏感的匹配将按照与Unicode标准相一致的方式进行。默认情况下,大小写不敏感的匹配假定只能在US-ASCII字符集中的字符才能进行
Pattern.UNIX_LINES(?d) 在这种模式下,在.、^和$行为中,只识别行终结符\n

在这些标记中 Pattern.CASE_INSENSITIVE(?i) ,Pattern.MULTLINE(?m),==Pattern.COMMENTS(?x)==中特别有用。

使用示例如下:

我们可以通过“或”( | )操作组合多个标记的功能

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ReFlags {
 public static void main(String[] args) {  
  Pattern p=Pattern.compile("^java",Pattern.CASE_INSENSITIVE|Pattern.MULTILINE);
  /*
   * 使用Pattern.CASE_INSENSITIVE(大小写不敏感的匹配)和Pattern.MULTILINE(多行模式)标记,忽略大小写地匹配所有以java开头的行
   */
  
  Matcher m=p.matcher("java has regex\nJava has regex\n"
    + "JAVA has pretty good regular expression\n"
    + "Regular expressions are in JavA");
  while (m.find()) { 
   System.out.println(m.group());//输出已匹配的部分  
  }
 }
}

输出结果:

java

Java

JAVA

使用Pattern.COMMENTS(?x)的例子:

import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class ReFlags_Comments {
 public static void main(String[] args) {
  /*
   * 不使用Pattern.COMMENTS(不启动注释)
   */
         String s="123";
         Pattern p1=Pattern.compile(" (\\d+)+#test comments");
         Matcher m1=p1.matcher(s);
         System.out.println(m1.matches());//false
         /*
                    * 正则表达式中使用启动注释的标记
          */
         Pattern p2=Pattern.compile("(?x) (\\d+)+#test comments");
         Matcher m2=p2.matcher(s);
         System.out.println(m2.matches());//true
         /*
               * 参数中使用Pattern.COMMENTS以启动注释
          */
         Pattern p3=Pattern.compile("  (\\d+)+#test comments",Pattern.COMMENTS);
         Matcher m3=p3.matcher(s);
         System.out.println(m3.matches());//true 
 }
}

运行结果:

false

true

true

Pattern.compile函数的相关解释

Pattern.compile函数:

Pattern Pattern.compile(String regex, int flag)

flag的取值范围如下:

  • Pattern.CANON_EQ:当且仅当两个字符的"正规分解(canonical decomposition)"都完全相同的情况下,才认定匹配。比如用了这个标志之后,表达 式"a\u030A"会匹配"?"。默认情况下,不考虑"规范相等性(canonical equivalence)"。
  • Pattern.CASE_INSENSITIVE: 默认情况下,大小写不敏感的匹配只适用于US-ASCII字符集。这个标志能让表达式忽略大小写进行匹配。要想对Unicode字符进行大小不明感的匹 配,只要将UNICODE_CASE与这个标志合起来就行了。
  • Pattern.COMMENTS: 在这种模式下,匹配时会忽略(正则表达式里的)空格字符(不是指表达式里的"\\s",而是指表达式里的空格,tab,回车之类)。注释从#开始,一直到这行结束。可以通过嵌入式的标志来启用Unix行模式。
  • Pattern.DOTALL: 在这种模式下,表达式'.'可以匹配任意字符,包括表示一行的结束符。默认情况下,表达式'.'不匹配行的结束符。
  • Pattern.MULTILINE: 在这种模式下,'^'和'$'分别匹配一行的开始和结束。此外,'^'仍然匹配字符串的开始,'$'也匹配字符串的结束。默认情况下,这两个表达式仅仅匹配字符串的开始和结束。
  • Pattern.UNICODE_CASE: 在这个模式下,如果你还启用了CASE_INSENSITIVE标志,那么它会对Unicode字符进行大小写不明感的匹配。默认情况下,大小写不敏感的匹配只适用于US-ASCII字符集。
  • Pattern.UNIX_LINES(?d) 在这个模式下,只有'\n'才被认作一行的中止,并且与'.','^',以及'$'进行匹配。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 如何使用Java爬虫批量爬取图片

    如何使用Java爬虫批量爬取图片

    这篇文章主要介绍了如何使用Java爬虫批量爬取图片,对于爬虫的入门来说,图片相对来说是比较容易获取的,因为大部分图片都不是敏感数据,所以不会遇到什么反爬措施,对于入门爬虫来说是比较合适的,需要的朋友可以参考下
    2023-04-04
  • JAVA 对象创建与对象克隆

    JAVA 对象创建与对象克隆

    这篇文章主要介绍了JAVA 对象创建与对象克隆,new 创建、反射、克隆、反序列化,克隆它分为深拷贝和浅拷贝,通过调用对象的 clone方法,进行对象的克隆,下面来看看文章的详细内容吧
    2022-02-02
  • springboot实现防重复提交和防重复点击的示例

    springboot实现防重复提交和防重复点击的示例

    这篇文章主要介绍了springboot实现防重复提交和防重复点击的示例,帮助大家更好的理解和学习springboot框架,感兴趣的朋友可以了解下
    2020-09-09
  • Java排序算法中的快速排序算法实现

    Java排序算法中的快速排序算法实现

    这篇文章主要介绍了Java排序算法中的快速排序算法实现,通过一趟排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,需要的朋友可以参考下
    2023-12-12
  • Java实现单向链表反转

    Java实现单向链表反转

    这篇文章主要为大家详细介绍了Java实现单向链表反转,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • 更改idea的JDK版本超简单便捷方法

    更改idea的JDK版本超简单便捷方法

    idea很多地方都设置了jdk版本,不同模块的jdk版本也可能不一样,下面这篇文章主要给大家介绍了关于更改idea的JDK版本的超简单便捷方法,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2023-11-11
  • Java异常java.lang.UnsatisfiedLinkError: no opencv_java320 in java.library.path的解决

    Java异常java.lang.UnsatisfiedLinkError: no opencv_ja

    这篇文章主要介绍了Java异常java.lang.UnsatisfiedLinkError: no opencv_java320 in java.library.path的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-12-12
  • Java 栈和队列的相互转换详解

    Java 栈和队列的相互转换详解

    栈和队列,严格意义上来说,也属于线性表,因为它们也都用于存储逻辑关系为 "一对一" 的数据,但由于它们比较特殊,因此将其单独作为一章,做重点讲解
    2022-02-02
  • Java中定时器java.util.Timer的简单模拟

    Java中定时器java.util.Timer的简单模拟

    在Java中,定时器(Timer)是一个工具类,用于安排任务在指定时间后执行或以指定的时间间隔重复执行,本文就来讲讲如何简单模拟实现定时器吧
    2023-07-07
  • Java 代码本地设置Hadoop用户名密码的方法

    Java 代码本地设置Hadoop用户名密码的方法

    在Hadoop环境中,通常使用Kerberos进行身份验证,这篇文章主要介绍了Java 代码本地设置Hadoop用户名密码的方法,需要的朋友可以参考下
    2024-08-08

最新评论