创建一个列表,其中包含起始位置和结束位置之间的值。

3
我有一个文本文件,其格式如下:
begin    end   
1        10    
25       35
40       50
37       48
...      ...

我使用以下命令创建一个包含所有从“begin”列到“end”列之间值的列表:

x <- read.table("in.txt")

result <- vector("list",486)
      for(i in 1:486){
      result[[i]] <- c(x[i,1]:x[i,2])
      }
lapply(result, write, "out.txt", append=TRUE, ncolumns = 1) 

因此,我得到了一个1列的文件,其中所有值都在不同的行上。现在我想做一些额外的事情。

与仅有“开始”和“结束”列的输入文件不同,我有两个额外的列,就像这样:

begin    end    A    B
1        10     x    0
25       35     x    1
40       50     x    2
37       48     y    0

我想要现在这些其他列的值也出现在我的输出中,这样我就可以得到如下结果。
position    A    B
1           X    0
2           X    0
3           X    0
...
10          X    0
...
40          X    2
41          X    2
...
37          Y    0        

我该怎样更改我的函数,使其输出看起来像这样?
2个回答

4

以下是 data.table 的解决方案:

require(data.table)
DT <- data.table(DF, key=c("A", "B"))
DT[, list(pos = seq(begin, end, by=1)),by=key(DT)]

1
+1 哇,非常感谢你提供的好解决方案,但是我可不想因为尝试理解它而感到头痛 :) - juba

2

以下是基本答案:

lapply(1:nrow(x), function(u) cbind(position=x$begin[u]:x$end[u], x[u,3:4]))

HTH


1
我觉得使用 seq(begin, end, by=1) 更好,因为当 begin > end 时,它会抛出一个错误。在某些情况下,这可能是可取的。 - Arun

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接