我曾试图使用
(作为奖励,如果您能告诉我是否有一个函数来识别特殊字符,那会很有帮助)。
我不确定SO的代码格式是否会改变破折号的格式,所以这里是我使用的破折号(–)。
gsub
替换我认为是标准破折号的符号。我测试的代码如下:
gsub("-", "ABC", "reported – estimate")
然而,这并没有起作用。我将破折号复制粘贴到http://unicodelookup.com/#–/1,发现它似乎是一个英文破折号。该网站提供了英文破折号的十六进制、十进制等代码,我一直在尝试替换英文破折号,但没有成功。有什么建议吗?(作为奖励,如果您能告诉我是否有一个函数来识别特殊字符,那会很有帮助)。
我不确定SO的代码格式是否会改变破折号的格式,所以这里是我使用的破折号(–)。
gsub("[[:ascii:]]+", "", s)
。这将从字符串中删除所有的ASCII字符,保留所有Unicode字符在结果中。 - Wiktor Stribiżewperl=T
,因为这是一个PCRE结构。 - Wiktor Stribiżew