Java正则表达式高效处理连续换行符和空格
本文探讨如何利用Java正则表达式,优雅地替换文本中连续出现的换行符 (包含中间空格的情况),并可选地去除首尾换行符。 问题在于将多个连续的换行符(可能包含空格)替换为单个换行符。例如,输入文本 aaaaaa: bbbbbbb ccccc ,期望输出 aaaaaa: bbbbbbb ccccc 。
之前尝试的 +s* *正则表达式未能成功的原因在于对Java字符串转义和正则表达式元字符的理解不足。 在Java字符串字面量中需写成\n,而在正则表达式中, 又需要转义,因此在Java代码中,匹配 的正则表达式应为\\n。
更有效的正则表达式是\n\s*\n,它匹配一个换行符,后跟零个或多个空格,再跟一个换行符。 无需+号,因为我们只需要匹配至少两个换行符及其间的空格,替换为单个 即可。
以下Java代码演示了如何实现这一替换,并额外处理了首尾换行符:
import java.util.regex.Matcher; import java.util.regex.Pattern; public class ReplaceNewLine { public static void main(String[] args) { String input = " AAAAAA: BBBBBBB CCCCC "; // 正则表达式匹配连续换行符和空格 Pattern pattern = Pattern.compile("\n\s*\n"); Matcher matcher = pattern.matcher(input); String output = matcher.replaceAll(" "); // 去除首尾换行符 output = output.trim(); System.out.println(output); } }
这段代码首先编译正则表达式\n\s*\n,然后使用replaceAll()方法将所有匹配项替换为单个 。 最后,trim()方法去除字符串首尾的空格和换行符,完善了结果。 这提供了一种简洁高效的解决方案。