我有一个字符串包含字母数字字符、特殊字符和非UTF-8字符。我想去除特殊字符和非UTF-8字符。
这是我尝试过的内容:
这是我尝试过的内容:
gsub('[^0-9a-z\\s]','',"�+ Sample string here =�{�>E�BH�P<]�{�>")
但是,这会去除特殊字符(标点符号+非UTF8字符),但输出结果没有空格。
gsub('/[^0-9a-z\\s]/i','',"�+ Sample string here =�{�>E�BH�P<]�{�>")
结果中有空格,但仍然存在非 utf8 字符。
有什么解决方法吗?
对于上面的示例字符串,输出应为: Sample string here
trimws(gsub('[^0-9A-Za-z ]','',"�+ Sample string here =�{�>E�BH�P<]�{�>"))
? - akrun[A-z]
不仅匹配字母。 - Wiktor Stribiżew