如何利用 java 正则表达式提取指定内容?
原文中提到需要过滤出特定的内容。为此,可以使用正则表达式来实现。正则表达式是一个字符串,用于描述要匹配的文本模式。这里是一个 java 正则表达式示例:
string reg = "www.*?(com|cn)";
- www.?:匹配 "www" 后面紧跟的任意字符,直到 ? 字符(它表示匹配 0 个或更多重复)。
- (com|cn):匹配字符串 "com" 或 "cn"。
- ?:将整个正则表达式标记为非贪婪,这意味着它将匹配最短的文本。
使用方法:
可以使用 matcher 类将正则表达式匹配到文本。下面是一个示例代码:
string html = "<a>www.baidu.com</a><a>www.qq.com</a><a>www.aaa.cn</a>www.eee.cn"; matcher matcher = pattern.compile(reg, pattern.case_insensitive).matcher(html); while (matcher.find()){ system.out.println(matcher.group()); }
匹配输出:
www.baidu.com www.qq.com www.aaa.cn www.eee.cn
通过这种方式,可以使用 java 正则表达式有效地从文本中过滤出想要的内容。