在Java中使用正则表达式转义双斜杠

4

我有这个单元测试:

public void testDeEscapeResponse() {
    final String[] inputs = new String[] {"peque\\\\u0f1o", "peque\\u0f1o"};
    final String[] expected = new String[] {"peque\\u0f1o", "peque\\u0f1o"};
    for (int i = 0; i < inputs.length; i++) {
        final String input = inputs[i];
        final String actual = QTIResultParser.deEscapeResponse(input);
        Assert.assertEquals(
            "deEscapeResponse did not work correctly", expected[i], actual);
    }
}

我有这个方法:

static String deEscapeResponse(String str) {
    return str.replaceAll("\\\\", "\\");
}

单元测试出现以下错误:

java.lang.StringIndexOutOfBoundsException: String index out of range: 1
    at java.lang.String.charAt(String.java:686)
    at java.util.regex.Matcher.appendReplacement(Matcher.java:703)
    at java.util.regex.Matcher.replaceAll(Matcher.java:813)
    at java.lang.String.replaceAll(String.java:2189)
    at com.acme.MyClass.deEscapeResponse
    at com.acme.MyClassTest.testDeEscapeResponse

为什么?
3个回答

4
请使用String.replace,它执行的是字面替换,而不是String.replaceAll,后者使用正则表达式。 示例:
"peque\\\\u0f1o".replace("\\\\", "\\")    //  gives  peque\u0f1o

String.replaceAll接受一个正则表达式,因此\\\\被解释为表达式\\,这将匹配单个\。(替换字符串对\也有特殊处理,所以那里也有错误。)

要使String.replaceAll按您的期望工作,您需要执行以下操作:

"peque\\\\u0f1o".replaceAll("\\\\\\\\", "\\\\")

1
你知道吗,我曾考虑使用replace,但我认为它与replaceAll完全相同,只不过它只替换了第一个实例。谢谢! - Paul Reiners
啊,我明白你为什么这样想了,因为有一个 replaceAll 方法 :-) - aioobe
1
尽管实际上有一个String.replaceFirst方法可以做到这一点 :-) - aioobe

2
我认为问题在于您使用了replaceAll()而不是replace()。replaceAll()函数首个参数需要一个正则表达式,而您只是想要进行字符串匹配。

1

请参阅 Matcher 的 javadoc:

请注意,替换字符串中的反斜杠(\)和美元符号($)可能会导致结果与将其视为字面替换字符串时不同。如上所述,美元符号可以被视为对捕获子序列的引用,而反斜杠用于转义替换字符串中的字面字符。

因此,使用 replaceAll 无法用反斜杠替换任何内容。因此,针对您的情况的一个非常疯狂的解决方法是 str.replaceAll("\\\\(\\\\)", "$1")


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接