0
点赞
收藏
分享

微信扫一扫

Java正则操作类Pattern和Matcher​详解

Java正则操作类Pattern和Matcher


Pattern类

Pattern位于java.util.regex包中,是正则表达式的编译表示形式,此类的实例是不可变的,可供多个并发线程安全使用。Pattern 类没有公共构造方法。要创建一个 Pattern 对象,你必须首先调用其公共静态compile方法,它返回一个

Pattern.split(CharSequence input)

split(CharSequence input)方法,用于分割字符串,返回一个String[]数组。如下:

public static void main(String[] args) {
 Pattern p = Pattern.compile("\\d+");
 String[] split = p.split("我的车牌号是京A123456这个车牌是我第100个靓号,我很喜欢。");
 for (String s : split) {
 System.out.println(s);
 }
}

输出结果:

我的车牌号是京A

这个车牌是我第

个靓号,我很喜欢。

Pattern.matches(String regex,CharSequence input)

静态方法用于快速匹配字符串该方法适合用于只匹配一次且匹配全部字符串该方法与String对象的matches方法一致,如下:

System.out.println("12345".matches("\\d+")); // true
System.out.println("车牌号12345".matches("\\d+")); // false
System.out.println("123d45".matches("\\d+")); // false

System.out.println(Pattern.matches("\\d+", "123456")); // true
System.out.println(Pattern.matches("\\d+", "车牌号123456")); // false
System.out.println(Pattern.matches("\\d+", "123abc456")); // false


Pattern.matcher(CharSequence input)

返回一个Matcher对象。Pattern类只能做一些简单的匹配操作,要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作。Matcher对象的没有公开的构造器,需要通过Pattern.mathcer方法创建实例,Matcher类提供了对正则表达式的分组支持以及对正则表达式的多次匹配支持

Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("4348东aldkf45赛发送");
matcher.pattern();//返回pattern 也就是返回创建本Matcher对象的Pattern对象


Matcher类

Matcher 对象是对输入字符串进行正则解释和匹配操作的引擎。与Pattern 类一样,Matcher 也没有公共构造方法。你需要调用 Pattern 对象的 matcher 方法来获得一个 Matcher 对象。


Matchermatches()lookingAt()和find()方法

Matcher类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false但需要注意的是matches()方法对整个字符串进行匹配,只有整个字符串都匹配正则规则时才返回true

lookingAt()对从字符串的开始位置进行匹配,只有匹配到的字符串在最前面才返回true。代码如下:

Pattern p2 = Pattern.compile("\\d+");
Matcher m2 = p2.matcher("123abc456");
System.out.println(m2.lookingAt()); // true

Matcher m3 = p2.matcher("abc1234");
System.out.println(m3.lookingAt()); // false


find()对字符串进行匹配匹配到的字符串可以在子字符串的任何位置。该方法表示是否存在与该模式匹配的下一个子字符串。简单来说就是在字符某部分匹配上模式就会返回true,同时匹配位置会记录到当前位置,再次调用时从该处匹配下一个位置,因此一般使用find配合循环和group方法获取全部的匹配子串。

Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("abc123de456fg");
System.out.println(matcher.find()); // true

循环获取字串:

Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher("abc123de456fg");
//System.out.println(matcher.find()); // true
while (matcher.find()){
 System.out.println(matcher.group());
}
输出:
123
456

Mathcer类的start()end()和group()方法

当使用matches(),lookingAt(),find()执行匹配操作后,可以利用以上三个方法得到更详细的信息。

  • start()返回匹配到的子字符串的第一个字符在字符串中的起始索引位置.
  • end()返回匹配到的子字符串的最后一个字符在字符串中的索引位置。
  • group()返回匹配到的子字符串

因此下面这段代码:

String src = "abc123de456fg";
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher(src);
while (matcher.find()){
 System.out.println(src.substring(matcher.start(), matcher.end()));
}

等价于:

String src = "abc123de456fg";
Pattern pattern = Pattern.compile("\\d+");
Matcher matcher = pattern.matcher(src);
while (matcher.find()){
 System.out.println(matcher.group());
}

start()end()group()均有一个对应的重载方法,分别是start(int i)end(int i)group(int i),它们专用于分组操作Mathcer类还有一个groupCount()方法用于返回有多少组


捕获

捕获组是把多个字符当一个独立单元进行处理的方法,它通过对括号内的字符分组来创建。组号按照左括号来数,只认左括号。

例如,正则表达式(dog)创建了单一分组,组里包含"d","o",和"g"。

捕获组是通过从左至右计算其开括号来编号,数左括号,依次数左括号的数量。例如,在表达式((A)(B(C))),有四个这样的组:

((A)(B(C)))

(A)

(B(C))

(C)

可以通过调用matcher对象的groupCount方法来查看表达式有多少个分组。groupCount方法返回一个int值,表示matcher对象当前有多个捕获组。还有一个特殊的组(group(0)),它总是代表整个表达式。该组不包括在groupCount的返回值中。

Pattern p = Pattern.compile("(\\D+)(\\d+)(\\D+)");
Matcher m = p.matcher("somewords123顶发动");
if (m.find()){
 System.out.println("分组个数:" + m.groupCount());
 System.out.println(m.group(0));
 System.out.println(m.group(1));
 System.out.println(m.group(2));
 System.out.println(m.group(3));
}
//////////////输出//////////////
分组个数:3
somewords123顶发动
somewords
123
顶发动






举报

相关推荐

0 条评论