在vim中使用正则表达式的Unicode字符

Question

在vim中使用正则表达式的Unicode字符

regexvimunicode

43

我太蠢了。

有人从微软Word中把一些文本复制粘贴到了我的html文件中。

现在在文本中出现了这些Unicode字符，而不是常规的引号符号（例如，引号显示为<92>）。

我想进行正则表达式替换，但我很难选择它们。

:%s/\u92/'/g
:%s/\u5C/'/g
:%s/\x92/'/g
:%s/\x5C/'/g

...所有的尝试都失败了。我的谷歌技能也让我失望了。

- aidan

3个回答

3

这个解决方案可能无法解决最初描述的问题，但它确实解决了一个不同但非常相关的问题，我认为把它放在这里是有意义的。

我不知道它是在哪个版本的Vim中实现的，但我在使用7.4时尝试过。

当处于编辑模式下时，输出Unicode字符的序列为：ctrl-vuxxxx，其中xxxx是代码点。例如，输出欧元符号将是ctrl-vu20ac。

我还尝试在命令模式下使用它，它也有效。也就是说，要将文档中所有出现的“20欧元”替换为“20€”，我会执行以下操作：

:%s/20 euro/20 <ctrl-v u 20ac>/gc

在上述内容中，<ctrl-v u 20ac>不是字面值，它是一系列按键，用于输出字符€。

- Michael Ekoka

0

我也遇到了同样的问题，当在CSV文件中我们能看到一些空格时，由于这个原因，我从程序中得到的输出带有Unicode值。在vim中使用下面的Unicode命令后，问题得到了解决。

:%s/%xa0//g

- Parthiban

根据目前的写法，你的回答不够清晰。请编辑以添加更多细节，帮助其他人理解如何解答所提出的问题。你可以在帮助中心找到关于如何撰写好回答的更多信息。 - undefined

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- michaelmichael · Accepted Answer

从 :help regexp（轻微编辑）中得知，在Vim中，您需要使用一些特定的语法来使用正则表达式选择Unicode字符：

\%u match specified multibyte character (eg \%u20ac)

那么，要搜索十六进制码为20AC的Unicode字符，请将其输入到搜索模式中：

\%u20ac

完整的字符搜索模式表包括一些额外选项：

\%d match specified decimal character (eg \%d123)
\%x match specified hex character (eg \%x2a)
\%o match specified octal character (eg \%o040)
\%u match specified multibyte character (eg \%u20ac)
\%U match specified large multibyte character (eg \%U12345678)