在df行中添加值

Question

在df行中添加值

3

我有一个数据框（df）中的一列，我想要添加值（不是常量，而是变量）。下面的示例将更加清楚：

> df
     geneID Sample.290
1         1  0.4018499
2        10  0.2694255
3       100  1.4441846
4      1000 13.7652753
5     10000  2.1552100
6 100008586  0.2358481

我希望将字符"ENSG"和多个"000"添加在一起，使每个值的总长度为15（包括ENSG）。例如，输出应如下所示：

         geneID           Sample.290
1        ENSG00000000001  0.4018499
2        ENSG00000000010  0.2694255
3        ENSG00000000100  1.4441846
4        ENSG00000001000 13.7652753
5        ENSG00000010000  2.1552100
6        ENSG00100008586  0.2358481

- Newbie

请参见 ?sprintf; sprintf("ENSG%011d", df$geneID)。 - alexis_laz

5个回答

3

使用基本功能：

df$geneID <- sapply(df$geneID,function(x) paste("ENSG",
                    paste(rep(0,(15-nchar(x)-nchar("ENSG"))),collapse = ""),x,sep=""))

变量的总长度为"15";

- SatishR

2

stringi包中的stri_pad_left函数可以实现你想要的功能。

df$geneID <- paste0('ENSG', stringi::stri_pad_left(df[, 'geneID'], width = 11, pad = '0'))

- David_B

1

或者你可以使用基本的R函数进行操作（使用基本R函数）：

# df
     # geneID Sample.290
# 1         1  0.4018499
# 2        10  0.2694255
# 3       100  1.4441846
# 4      1000 13.7652753
# 5     10000  2.1552100
# 6 100008586  0.2358481

a="ENSG00000000000"
df[,'geneID']=sapply(1:nrow(df), function(i) 
paste0(substring(a, 1, 15-nchar(df[i,'geneID'])), df[i,'geneID']))

# > df
           # geneID Sample.290
# 1 ENSG00000000001  0.4018499
# 2 ENSG00000000010  0.2694255
# 3 ENSG00000000100  1.4441846
# 4 ENSG00000001000 13.7652753
# 5 ENSG00000010000  2.1552100
# 6 ENSG00100008586  0.2358481

- 989

0

我会选择Sotos的例子（当我阅读您的帖子时，这是我立即想到的），使用str_pad命令

- sorearm

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Sotos · Accepted Answer

使用 stringr 中的 str_pad：

library(stringr)
df$geneID <- paste0('ENSG', str_pad(df$geneID, width = 11, pad = '0'))
df
#           geneID Sample.290
#1 ENSG00000000001  0.4018499
#2 ENSG00000000010  0.2694255
#3 ENSG00000000100  1.4441846
#4 ENSG00000001000 13.7652753
#5 ENSG00000010000  2.1552100
#6 ENSG00100008586  0.2358481