如何使用grep()/gsub()函数进行精确匹配

76
string = c("apple", "apples", "applez")
grep("apple", string)

这将为我提供所有三个元素在 string 中的索引。但我想精确匹配单词 "apple" (即,我只希望 grep() 返回索引 1)。


5
对于精确匹配,请考虑使用==match - flodel
1
gsub 怎么办,而不是 grep? - tumultous_rooster
如果您不需要grep的参数,比如ignore.case = truevalue = true,那么结合使用any==是更好的选择。 - Sanjid
相关 https://dev59.com/YWw05IYBdhLWcg3weBlF - zx8754
2个回答

133
使用单词边界 \b,匹配单词和非单词字符之间的位置。
string = c("apple", "apples", "applez")
grep("\\bapple\\b", string)
[1] 1

或者

使用锚点。 ^ 断言我们在开头。 $ 断言我们在结尾。

grep("^apple$", string)
[1] 1

您可以将正则表达式存储在变量中,然后像下面这样使用它。

pat <- "\\bapple\\b"
grep(pat, string)
[1] 1
pat <- "^apple$"
grep(pat, string)
[1] 1

更新:

paste("^",pat,"$", sep="")
[1] "^apple$"
string
[1] "apple"   "apple:s" "applez" 
pat
[1] "apple"
grep(paste("^",pat,"$", sep=""), string)
[1] 1

5
paste0("^",pat,"$")比使用paste更省打字。不需要加入sep="" - Ben

43

对于精确匹配,使用== 最为合理。此外,这比使用grep() 更快,并且显然更容易。

which(string == "apple")
# [1] 1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接