在df行中添加值

3

我有一个数据框(df)中的一列,我想要添加值(不是常量,而是变量)。下面的示例将更加清楚:

> df
     geneID Sample.290
1         1  0.4018499
2        10  0.2694255
3       100  1.4441846
4      1000 13.7652753
5     10000  2.1552100
6 100008586  0.2358481

我希望将字符"ENSG"和多个"000"添加在一起,使每个值的总长度为15(包括ENSG)。例如,输出应如下所示:

         geneID           Sample.290
1        ENSG00000000001  0.4018499
2        ENSG00000000010  0.2694255
3        ENSG00000000100  1.4441846
4        ENSG00000001000 13.7652753
5        ENSG00000010000  2.1552100
6        ENSG00100008586  0.2358481

请参见 ?sprintf; sprintf("ENSG%011d", df$geneID) - alexis_laz
5个回答

5
使用 stringr 中的 str_pad
library(stringr)
df$geneID <- paste0('ENSG', str_pad(df$geneID, width = 11, pad = '0'))
df
#           geneID Sample.290
#1 ENSG00000000001  0.4018499
#2 ENSG00000000010  0.2694255
#3 ENSG00000000100  1.4441846
#4 ENSG00000001000 13.7652753
#5 ENSG00000010000  2.1552100
#6 ENSG00100008586  0.2358481

3

使用基本功能:

df$geneID <- sapply(df$geneID,function(x) paste("ENSG",
                    paste(rep(0,(15-nchar(x)-nchar("ENSG"))),collapse = ""),x,sep=""))

变量的总长度为"15";

2
stringi包中的stri_pad_left函数可以实现你想要的功能。
df$geneID <- paste0('ENSG', stringi::stri_pad_left(df[, 'geneID'], width = 11, pad = '0'))

1
或者你可以使用基本的R函数进行操作(使用基本R函数):
# df
     # geneID Sample.290
# 1         1  0.4018499
# 2        10  0.2694255
# 3       100  1.4441846
# 4      1000 13.7652753
# 5     10000  2.1552100
# 6 100008586  0.2358481

a="ENSG00000000000"
df[,'geneID']=sapply(1:nrow(df), function(i) 
paste0(substring(a, 1, 15-nchar(df[i,'geneID'])), df[i,'geneID']))

# > df
           # geneID Sample.290
# 1 ENSG00000000001  0.4018499
# 2 ENSG00000000010  0.2694255
# 3 ENSG00000000100  1.4441846
# 4 ENSG00000001000 13.7652753
# 5 ENSG00000010000  2.1552100
# 6 ENSG00100008586  0.2358481

0

我会选择Sotos的例子(当我阅读您的帖子时,这是我立即想到的),使用str_pad命令


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接