如何在R中从字符串中去除正则表达式?

4

这个字符串是 "\r\n\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t\t\tLocation\r\n\t\t\t\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t\t\t\t\tSan Francisco, CA;Oakland, CA",我希望它显示为 "Location","San Francisco, CA;Oakland, CA"

有没有相关的函数可以实现呢?谢谢!

2个回答

6
你可以使用正则表达式来移除特殊字符:
x <-"\r\n\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t\t\tLocation\r\n\t\t\t\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t\t\t\t\tSan Francisco, CA;Oakland, CA"

gsub('[\r\n\t]', '', x)

然而,如果你真的有一个包含所有这些 \ 的字符串,答案就变成了:

gsub('\\\\[a-z]', '', x)

2

不清楚您是否需要将字符串的两个部分分开。如果需要,可以使用以下方法:

test <- c("\r\n\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t\t\tLocation\r\n\t\t\t\t\t\t\t\t\t\t\t\r\n\t\t\t\t\t\t\t\t\t\t\tSan Francisco, CA;Oakland, CA")
result <- unlist(strsplit(test,"\\r|\\n|\\t"))
result <- result[result!=""]
result
[1] "Location"                      "San Francisco, CA;Oakland, CA"

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接