标签导航:

java正则表达式如何提取指定文本内容?

如何利用 java 正则表达式提取指定内容?

原文中提到需要过滤出特定的内容。为此,可以使用正则表达式来实现。正则表达式是一个字符串,用于描述要匹配的文本模式。这里是一个 java 正则表达式示例:

string reg = "www.*?(com|cn)";
  • www.?:匹配 "www" 后面紧跟的任意字符,直到 ? 字符(它表示匹配 0 个或更多重复)。
  • (com|cn):匹配字符串 "com" 或 "cn"。
  • ?:将整个正则表达式标记为非贪婪,这意味着它将匹配最短的文本。

使用方法:

可以使用 matcher 类将正则表达式匹配到文本。下面是一个示例代码:

string html = "<a>www.baidu.com</a><a>www.qq.com</a><a>www.aaa.cn</a>www.eee.cn";
matcher matcher  = pattern.compile(reg, pattern.case_insensitive).matcher(html);
while (matcher.find()){
    system.out.println(matcher.group());
}

匹配输出:

www.baidu.com
www.qq.com
www.aaa.cn
www.eee.cn

通过这种方式,可以使用 java 正则表达式有效地从文本中过滤出想要的内容。