Java正则表达式\cx（控制字符）

Question

5

Javadoc对java.util.regex.Pattern的说明中提到\cx代表x所对应的控制字符。因此，我认为Pattern.compile()会拒绝除[@-_]之外的任何字符后面跟着一个\c，但实际上并不是这样的！

正如@tchrist在What is a regular expression for control characters?的答案之一中所评论的那样，根本没有检查范围。我测试了几个来自更高块和星位平面的字符，看起来它仅仅翻转了代码点值的第7个最低位。

那么，这是Javadoc的错误还是实现的错误，还是我理解错了？\cx是Java发明的语法还是其他正则表达式引擎支持的，尤其是Perl？在那里如何处理？

- user1089451

2

你忘记了\c?。^?指的是DEL控制字符（0x7F）。 - ikegami

@ikegami 是的，你说得对。我总是忘记0x7F，因为它总是独自呆在角落里。 - user1089451

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- ikegami · Accepted Answer

以下转义字符在所有版本的Perl中都表现一致：

没有其他的序列是有意义的，但是错误检查只在 Perl 5.20 中引入。