标签导航:

java正则表达式如何替换连续换行符及空格?

Java正则表达式高效处理连续换行符和空格

本文探讨如何利用Java正则表达式,优雅地替换文本中连续出现的换行符 (包含中间空格的情况),并可选地去除首尾换行符。 问题在于将多个连续的换行符(可能包含空格)替换为单个换行符。例如,输入文本 aaaaaa: bbbbbbb ccccc ,期望输出 aaaaaa: bbbbbbb ccccc 。

之前尝试的 +s* *正则表达式未能成功的原因在于对Java字符串转义和正则表达式元字符的理解不足。 在Java字符串字面量中需写成\n,而在正则表达式中, 又需要转义,因此在Java代码中,匹配 的正则表达式应为\\n。

更有效的正则表达式是\n\s*\n,它匹配一个换行符,后跟零个或多个空格,再跟一个换行符。 无需+号,因为我们只需要匹配至少两个换行符及其间的空格,替换为单个 即可。

以下Java代码演示了如何实现这一替换,并额外处理了首尾换行符:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class ReplaceNewLine {
    public static void main(String[] args) {
        String input = "
AAAAAA: 

BBBBBBB 
 

CCCCC


";
        // 正则表达式匹配连续换行符和空格
        Pattern pattern = Pattern.compile("\n\s*\n"); 
        Matcher matcher = pattern.matcher(input);
        String output = matcher.replaceAll("
");
        // 去除首尾换行符
        output = output.trim(); 
        System.out.println(output);
    }
}

这段代码首先编译正则表达式\n\s*\n,然后使用replaceAll()方法将所有匹配项替换为单个 。 最后,trim()方法去除字符串首尾的空格和换行符,完善了结果。 这提供了一种简洁高效的解决方案。