Java 正则表达式详解（3）

论坛元老

Rank: 8 Rank: 8

UID: 1066743

1^#

打印

字体大小: tT

look_w发表于 2018-12-15 13:43 | 只看该作者

Java 正则表达式详解（3）

group()假设想在一个文本中查找URL链接，并且想把找到的链接提取出来。当然可以通过 start()和 end()方法完成。但是用group()方法更容易些。
分组在正则表达式中用括号表示，例如:
(John)
此正则表达式匹配John, 括号不属于要匹配的文本。括号定义了一个分组。当正则表达式匹配到文本后，可以访问分组内的部分。
使用group(int groupNo) 方法访问一个分组。一个正则表达式可以有多个分组。每个分组由一对括号标记。想要访问正则表达式中某分组匹配的文本，可以把分组编号传入 group(int groupNo)方法。
group(0) 表示整个正则表达式，要获得一个有括号标记的分组，分组编号应该从1开始计算。

1
2
3
4
5
6
7
8

String text = "John writes about this, and John writes about that," +
" and John writes about everything. " ;
String patternString1 = "(John)";
Pattern pattern = Pattern.compile(patternString1);
Matcher matcher = pattern.matcher(text);
while(matcher.find()) {
System.out.println("found: " + matcher.group(1));
}

以上代码在文本中搜索单词John.从每个匹配文本中，提取分组1，就是由括号标记的部分。输出如下

1
2
3

found: John
found: John
found: John

多分组上面提到，一个正则表达式可以有多个分组，例如：
(John) (.+?)
这个表达式匹配文本”John” 后跟一个空格,然后跟1个或多个字符，最后跟一个空格。你可能看不到最后的空格。
这个表达式包括一些字符有特别意义。字符点 . 表示任意字符。字符 + 表示出现一个或多个，和. 在一起表示任何字符,出现一次或多次。字符? 表示匹配尽可能短的文本。
完整代码如下

1
2
3
4
5
6
7
8
9
10
11

String text =
      "John writes about this, and John Doe writes about that," +
               " and John Wayne writes about everything."
      ;
String patternString1 = "(John) (.+?) ";
Pattern pattern = Pattern.compile(patternString1);
Matcher matcher = pattern.matcher(text);
while(matcher.find()) {
System.out.println("found: " + matcher.group(1) +
                     " "    + matcher.group(2));
}

注意代码中引用分组的方式。代码输出如下

1
2
3

found: John writes
found: John Doe
found: John Wayne

收藏分享评分

回复引用

订阅 TOP

返回列表