无涯教程-Java - 正则表达式-程序员宅基地

技术标签: java  无涯教程  

Java为使用正则表达式进行模式匹配提供了java.util.regex包,Java正则表达式非常类似于Perl编程语言,并且非常容易学习。

regex包主要由以下三个类组成

  • Pattern class                       - Pattern对象是正则表达式的表示形式,没有提供公共构造函数。

  • Matcher class                     - Matcher对象是解释模式并对输入字符串执行匹配操作的引擎。

  • PatternSyntaxException  -  PatternSyntaxException对象是一个未检查的异常,指示正则表达式模式中的语法错误。

捕获组

捕获组是一种将多个字符视为一个单元的方法。如正则表达式(Dog)创建一个包含字母“ d”,“ o”和“ g”的单个组。

捕获组通过从左到右计数其左括号进行编号。如在表达式(A)(B(C)中,存在四个这样的组-

  • ((A)(B(C)))
  • (A)
  • (B(C))
  • (C)

若要了解表达式中存在多少个组,请对Matcher 对象调用groupCount方法,groupCount方法返回一个int,显示匹配器模式中存在的捕获组的数量。

还有一个特殊的组,组0,它始终表示整个表达式,此组不包括在groupCount报告的总数中。

以下示例说明如何从给定的字母数字字符串中查找数字字符串

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexMatches {
   

   public static void main( String args[] ) {
   
      //要扫描的字符串以查找模式。
      String line = "This order was placed for QT3000! OK?";
      String pattern = "(.*)(\\d+)(.*)";

      //创建Pattern对象
      Pattern r = Pattern.compile(pattern);

      //现在创建匹配器对象。
      Matcher m = r.matcher(line);
      if (m.find( )) {
   
         System.out.println("Found value: " + m.group(0) );
         System.out.println("Found value: " + m.group(1) );
         System.out.println("Found value: " + m.group(2) );
      }else {
   
         System.out.println("NO MATCH");
      }
   }
}

这将产生以下输出-

Found value: This order was placed for QT3000! OK?
Found value: This order was placed for QT300
Found value: 0

表达式语法

下面的表列出了java-中可用的所有正则表达式元字符语法

Subexpression Matches
^ 匹配行的开头。
$ 匹配行的结尾。
. 匹配除换行符以外的任何单个字符。
[...] 匹配括号中的任何单个字符。
[^...] 匹配任何不在方括号中的单个字符。
\A 整个字符串的开头。
\z 整个字符串的结尾。
 \Z 整个字符串的结尾,但允许的最后一行终止符除外。
re* 匹配0个或多个
re+ 匹配1个或多个
re? 匹配0或1个。
re{ n} 精确匹配n个。
re{ n,} 至少匹配n个。
re{ n, m} 至少匹配n个,最多匹配m个。
a| b 匹配a或b。
(re) 分组匹配
 (?: re) 分组匹配,而无需记住匹配的文本。
(?> re) 匹配独立模式而不回溯。
\w 匹配单词字符。
\W 匹配非单词字符。
\s 匹配空白。 等效于[\t\n\r\f]。
\S 匹配非空格。
\d 匹配数字。 相当于[0-9]。
\D 匹配非数字。
\A 匹配字符串的开头。
 \Z 匹配字符串的结尾。 如果存在换行符,则匹配换行符。
\z 匹配字符串的结尾。
\G 匹配最后结束点。
\n 匹配换行“n”。
\b 匹配单词边界。
\B 匹配非单词边界。
\n,\t, etc. 匹配换行符,回车符,制表符等。
\Q 转义(引号)所有字符,直到\E。
\E 结束语以\Q开头。

Matcher方法

索引方法提供有用的索引值,这些索引值精确地显示了在输入字符串-中找到匹配的位置

Sr.No. Method & Remark
1

public int start()

返回上一个匹配项的开始索引。

2

public int start(Int Group)

返回给定组在上一次匹配操作期间捕获的子序列的开始索引。

3

public int end()

返回匹配的最后一个字符之后的偏移量。

4

public int end(Int Group)

返回在上一个匹配操作期间由给定组捕获的子序列的最后一个字符之后的偏移量。

查找方法

查找方法检查输入字符串并返回一个布尔值,指示是否找到-模式

Sr.No. Method & Remark
1

public boolean lookingAt()

尝试将输入序列与模式进行匹配,从开头开始。

2

public boolean find()

尝试查找与模式匹配的输入序列的下一个子序列。

3

public boolean find(Int Start)

重置此匹配器,然后尝试查找与模式匹配的输入序列的下一个子序列,从指定的索引处开始。

4

public boolean matches()

尝试将整个区域与模式进行匹配。

替换方法

替换方法是用于替换输入字符串中的文本的有用方法

Sr.No. Method & Remark
1

public Matcher appendReplace(StringBuffer sb,String replacement)

实现追加和替换操作。

2

public StringBuffer appendTail(StringBuffer sb)

实现终端附加和替换步骤。

3

public String replaceAll(String replacement)

用给定的替换字符串替换与模式匹配的输入序列的每个子序列。

4

public String replaceFirst(String replacement)

用给定的替换字符串替换与模式匹配的输入序列的第一个子序列。

5

public static String quoteReplace(string s)

返回指定字符串的文字替换字符串。此方法生成一个字符串,该字符串将作为Matcher类的appendReplace方法中的文字替换。

Start和End方法示例

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexMatches {
   

   private static final String REGEX = "\\bcat\\b";
   private static final String INPUT = "cat cat cat cattie cat";

   public static void main( String args[] ) {
   
      Pattern p = Pattern.compile(REGEX);
      Matcher m = p.matcher(INPUT);   //获取匹配器对象
      int count = 0;

      while(m.find()) {
   
         count++;
         System.out.println("Match number "+count);
         System.out.println("start(): "+m.start());
         System.out.println("end(): "+m.end());
      }
   }
}

这将产生以下输出-

Match number 1
start(): 0
end(): 3
Match number 2
start(): 4
end(): 7
Match number 3
start(): 8
end(): 11
Match number 4
start(): 19
end(): 22

Matches and lookingAt 方法示例

matches和lookingAt方法都试图将输入序列与模式进行匹配。然而,不同的是,matches要求匹配整个输入序列,而lookingAt不需要。

这两种方法始终从输入字符串的开头开始。下面是解释函数-的示例

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexMatches {
   

   private static final String REGEX = "foo";
   private static final String INPUT = "fooooooooooooooooo";
   private static Pattern pattern;
   private static Matcher matcher;

   public static void main( String args[] ) {
   
      pattern = Pattern.compile(REGEX);
      matcher = pattern.matcher(INPUT);

      System.out.println("Current REGEX is: "+REGEX);
      System.out.println("Current INPUT is: "+INPUT);

      System.out.println("lookingAt(): "+matcher.lookingAt());
      System.out.println("matches(): "+matcher.matches());
   }
}

这将产生以下输出-

Current REGEX is: foo
Current INPUT is: fooooooooooooooooo
lookingAt(): true
matches(): false

replaceFirst和replaceAll方法示例

replaceFirst和replaceAll方法替换与给定正则表达式匹配的文本。顾名思义,replaceFirst替换第一个匹配项,replaceAll替换所有匹配项。

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexMatches {
   

   private static String REGEX = "dog";
   private static String INPUT = "The dog says meow. " + "All dogs say meow.";
   private static String REPLACE = "cat";

   public static void main(String[] args) {
   
      Pattern p = Pattern.compile(REGEX);
      
      //获取匹配器对象
      Matcher m = p.matcher(INPUT); 
      INPUT = m.replaceAll(REPLACE);
      System.out.println(INPUT);
   }
}

这将产生以下输出-

The cat says meow. All cats say meow.

appendReplace和appendTail方法示例

Matcher类还为文本替换提供appendReplace和appendTail方法。

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexMatches {
   

   private static String REGEX = "a*b";
   private static String INPUT = "aabfooaabfooabfoob";
   private static String REPLACE = "-";
   public static void main(String[] args) {
   

      Pattern p = Pattern.compile(REGEX);
      
      //获取匹配器对象
      Matcher m = p.matcher(INPUT);
      StringBuffer sb = new StringBuffer();
      while(m.find()) {
   
         m.appendReplacement(sb, REPLACE);
      }
      m.appendTail(sb);
      System.out.println(sb.toString());
   }
}

这将产生以下输出-

-foo-foo-foo-

PatternSyntaxException 

PatternSyntaxException是一个未经检查的异常,它指示正则表达式模式中的语法错误。PatternSyntaxException类提供以下方法来帮助您确定错误的-

Sr.No. Method & Remark
1

public String getRemark()

检索错误的说明。

2

public int getIndex()

检索错误索引。

3

public String getPattern()

检索错误的正则表达式模式。

4

public String getMessage()

返回一个多行字符串,其中包含语法错误及其索引的说明、错误的正则表达式模式以及模式内错误索引的可视指示。

Java - 正则表达式 - 无涯教程网无涯教程网提供Java为使用正则表达式进行模式匹配提供了java.util.regex包,Java正则表达式非常类似...https://www.learnfk.com/java/java-regular-expressions.html

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/w116858389/article/details/137112910

智能推荐

WCE Windows hash抓取工具 教程_wce.exe -s aaa:win-9r7tfgsiqkf:0000000000000000000-程序员宅基地

文章浏览阅读6.9k次。WCE 下载地址:链接:https://share.weiyun.com/5MqXW47 密码:bdpqku工具界面_wce.exe -s aaa:win-9r7tfgsiqkf:00000000000000000000000000000000:a658974b892e

各种“网络地球仪”-程序员宅基地

文章浏览阅读4.5k次。Weather Globe(Mackiev)Google Earth(Google)Virtual Earth(Microsoft)World Wind(NASA)Skyline Globe(Skylinesoft)ArcGISExplorer(ESRI)国内LTEarth(灵图)、GeoGlobe(吉奥)、EV-Globe(国遥新天地) 软件名称: 3D Weather Globe(http:/_网络地球仪

程序员的办公桌上,都出现过哪些神奇的玩意儿 ~_程序员展示刀,产品经理展示枪-程序员宅基地

文章浏览阅读1.9w次,点赞113次,收藏57次。我要买这些东西,然后震惊整个办公室_程序员展示刀,产品经理展示枪

霍尔信号、编码器信号与电机转向-程序员宅基地

文章浏览阅读1.6w次,点赞7次,收藏63次。霍尔信号、编码器信号与电机转向从电机出轴方向看去,电机轴逆时针转动,霍尔信号的序列为编码器信号的序列为将霍尔信号按照H3 H2 H1的顺序组成三位二进制数,则霍尔信号翻译成状态为以120°放置霍尔为例如不给电机加电,使用示波器测量三个霍尔信号和电机三相反电动势,按照上面所说的方向用手转动电机得到下图① H1的上升沿对应电机q轴与H1位置电角度夹角为0°,..._霍尔信号

个人微信淘宝客返利机器人搭建教程_怎么自己制作返利机器人-程序员宅基地

文章浏览阅读7.1k次,点赞5次,收藏36次。个人微信淘宝客返利机器人搭建一篇教程全搞定天猫淘宝有优惠券和返利,仅天猫淘宝每年返利几十亿,你知道么?技巧分享:在天猫淘宝京东拼多多上挑选好产品后,按住标题文字后“复制链接”,把复制的淘口令或链接发给机器人,复制机器人返回优惠券口令或链接,再打开天猫或淘宝就能领取优惠券啦下面教你如何搭建一个类似阿可查券返利机器人搭建查券返利机器人前提条件1、注册微信公众号(订阅号、服务号皆可)2、开通阿里妈妈、京东联盟、拼多多联盟一、注册微信公众号https://mp.weixin.qq.com/cgi-b_怎么自己制作返利机器人

【团队技术知识分享 一】技术分享规范指南-程序员宅基地

文章浏览阅读2.1k次,点赞2次,收藏5次。技术分享时应秉持的基本原则:应有团队和个人、奉献者(统筹人)的概念,同时匹配团队激励、个人激励和最佳奉献者激励;团队应该打开工作内容边界,成员应该来自各内容方向;评分标准不应该过于模糊,否则没有意义,应由客观的基础分值以及分团队的主观综合结论得出。应有心愿单激励机制,促进大家共同聚焦到感兴趣的事情上;选题应有规范和框架,具体到某个小类,这样收获才有目标性,发布分享主题时大家才能快速判断是否是自己感兴趣的;流程和分享的模版应该有固定范式,避免随意的格式导致随意的内容,评分也应该部分参考于此;参会原则,应有_技术分享

随便推点

O2OA开源企业办公开发平台:使用Vue-CLI开发O2应用_vue2 oa-程序员宅基地

文章浏览阅读1k次。在模板中,我们使用了标签,将由o2-view组件负责渲染,给o2-view传入了两个参数:app="内容管理数据"和name="所有信息",我们将在o2-view组件中使用这两个参数,用于展现“内容管理数据”这个数据应用下的“所有信息”视图。在o2-view组件中,我们主要做的事是,在vue组件挂载后,将o2的视图组件,再挂载到o2-view组件的根Dom对象。当然,这里我们要在我们的O2服务器上创建好数据应用和视图,对应本例中,就是“内容管理数据”应用下的“所有信息”视图。..._vue2 oa

[Lua]table使用随笔-程序员宅基地

文章浏览阅读222次。table是lua中非常重要的一种类型,有必要对其多了解一些。

JAVA反射机制原理及应用和类加载详解-程序员宅基地

文章浏览阅读549次,点赞30次,收藏9次。我们前面学习都有一个概念,被private封装的资源只能类内部访问,外部是不行的,但这个规定被反射赤裸裸的打破了。反射就像一面镜子,它可以清楚看到类的完整结构信息,可以在运行时动态获取类的信息,创建对象以及调用对象的属性和方法。

Linux-LVM与磁盘配额-程序员宅基地

文章浏览阅读1.1k次,点赞35次,收藏12次。Logical Volume Manager,逻辑卷管理能够在保持现有数据不变的情况下动态调整磁盘容量,从而提高磁盘管理的灵活性/boot分区用于存放引导文件,不能基于LVM创建PV(物理卷):基于硬盘或分区设备创建而来,生成N多个PE,PE默认大小4M物理卷是LVM机制的基本存储设备,通常对应为一个普通分区或整个硬盘。创建物理卷时,会在分区或硬盘的头部创建一个保留区块,用于记录 LVM 的属性,并把存储空间分割成默认大小为 4MB 的基本单元(PE),从而构成物理卷。

车充产品UL2089安规测试项目介绍-程序员宅基地

文章浏览阅读379次,点赞7次,收藏10次。4、Dielecteic voltage-withstand test 介电耐压试验。1、Maximum output voltage test 输出电压试验。6、Resistance to crushing test 抗压碎试验。8、Push-back relief test 阻力缓解试验。7、Strain relief test 应变消除试验。2、Power input test 功率输入试验。3、Temperature test 高低温试验。5、Abnormal test 故障试验。

IMX6ULL系统移植篇-系统烧写原理说明_正点原子 imx6ull nand 烧录-程序员宅基地

文章浏览阅读535次。镜像烧写说明_正点原子 imx6ull nand 烧录