我正在处理NCBI参考序列访问号,例如变量a
:
a <- c("NM_020506.1","NM_020519.1","NM_001030297.2","NM_010281.2","NM_011419.3", "NM_053155.2")
从biomart包中获取信息时,我需要删除访问号后面的.1
,.2
等字符。 我通常使用以下代码来完成此操作:
b <- sub("..*", "", a)
# [1] "" "" "" "" "" ""
但是正如您所看到的,这不是这个变量的正确用法。有谁能帮助我解决这个问题吗?
stringr
),选项如下所示: b1 <- gsub("\..","",a, fixed=FALSE) b2 <- sub("\..","",a, fixed=FALSE) 在某些情况下,您可能需要更改fixed
参数。但是,在这里,您必须将其设置为FALSE
(默认值);否则它将无法工作。此外,您需要双重转义符号\\
,否则会出现错误。 - David C.