我有一个由向量组成的向量
data<-c("Mark And (BD Marketing Da 1 Z _ 9793)",
"Andre All (BD Marketing DA 1 Z _ 9794 (plus))",
"Alli Inn (BD Sport Educ 1 C _ 9722 (plus))",
"Alli Inn (BP Sport Educ 1 Z _ 9347)")
现在我需要删除_之前的所有字符,并且删除括号(如果缺少单词(plus))。因此,结果应该是:
Mark And BD Marketing Da 1 Z
Andre All BD Marketing DA 1 Z (plus)
Alli Inn BD Sport Educ 1 C (plus)
Alli Inn BP Sport Educ 1 Z
我使用gsub("\\s*\\w*$", "", data)
并获得了以下结果
Alli Inn (BP Sport Educ 1 Z
但这不正确,因为我需要删除其他括号,并保留写在 (plus) 中的内容。
我已经尝试过这个代码:
gsub('\((?!plus)|(?<!plus)\)|.\\d+', '', rownames(data), perl=TRUE)
,得到了这个结果:
Alli Inn BP Sport Educ Z
,但现在我错过了字母前的数字1。