将Reduce/do.call转换为在数据框列表的列表中绑定行。

3

我很难用简单的英语表达这个问题,如果有人可以编辑语言,那将不胜感激。

我有一个列表对象,其中每个元素都是data.frame结构的list

顶层列表中的某些元素可能为空,而其他元素具有不同数量的数据框(尽管始终是偶数)。

我的问题(看起来非常像这个问题的相反面)是:

如何绑定这些列表中数据框的行,以便每个顶层列表元素都包含两个数据框? 这些数据框每次都遵循相同的结构(我想绑定数据框1,3,5,7...和数据框2,4,6,8...的行)。

MRE 如下:

set.seed(1234)
listy <- list(`1` = list(),
              `2` = list(a = data.frame(a1 = runif(1:3), a2 = runif(1:3)),
                         b  = data.frame(a3 = runif(1:3), a4 = runif(1:3)),
                         c = data.frame(a1 = runif(1:3), a2 = runif(1:3)),
                         d = data.frame(a3 = runif(1:3), a4 = runif(1:3))))
listy是一个包含2个元素的列表(12)。其中1为空。2是一个由data.frames组成的列表(每个都有偶数个data.frames)。我想要将2的行绑定在一起,以便顶级列表的每个元素都有2个data.frames(如果它们原来就有data.frames的话)。
我的预期输出如下:
listb <- list(`1` = list(), 
          `2` = list(structure(list(a1 = c(0.113703411305323, 0.622299404814839, 0.609274732880294, 0.282733583590016, 0.923433484276757, 0.292315840255469), a2 = c(0.623379441676661, 0.860915383556858, 0.640310605289415, 0.837295628152788, 0.286223284667358, 0.266820780001581)), .Names = c("a1", "a2"), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame")), structure(list(a3 = c(0.0094957563560456, 0.232550506014377, 0.666083758231252, 0.186722789658234, 0.232225910527632, 0.316612454829738), a3.1 = c(0.514251141343266, 0.693591291783378, 0.544974835589528, 0.302693370729685, 0.159046002896503, 0.0399959180504084)), .Names = c("a3", "a3.1"), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame"))))

理想情况下,我想保留listy及其结构(第一个元素为空),第二个元素只包含绑定行。这就是为什么我尝试了以下操作,但没有成功:

library(dplyr)
lapply(length(listy), function(i) {
  #skip empty lists
  if(length(listy[[i]]) < 1) {
    next
  } else {
    #make two lists
    #pairs list. even numbers
    listy[[i]][[1]] <- do.call(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 0])
    #pairs list. odd numbers
    listy[[i]][[2]] <- do.call(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 1])
  }
}) 


#another try, no positive result
lapply(length(listy), function(i) {
  #skip empty lists
  if(length(listy[[i]]) < 1) {
    next
  } else {
    #make two lists
    #pairs list. even numbers
    listy[[i]][[1]] <- Reduce(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 0])
    #pairs list. odd numbers
    listy[[i]][[2]] <- Reduce(bind_rows, listy[[i]][seq(1,length(listy[[i]]), by = 1) %% 2 == 1])
  }
}) 

你只是想将数据框rbind在一起,还是需要对列名进行处理? - Heroka
列名应保持不变(当我逐个绑定它们时,它们确实保持不变)。如果我的MRE输出有误,请告诉我,以便我可以进行编辑。 - erasmortg
在你的listy[[2]]中,数据框b有列名a3和a3,而d有a4和a4列。 - Heroka
@Heroka 我会相应地进行编辑 - erasmortg
1个回答

2
< p >【假设列名匹配】通常更容易对列表本身进行lapply操作,因为这样更容易操作,而不是使用索引。下面是示例代码:

    listy2 <- lapply(listy, function(x){
      #get length
      current_length=length(x)
      if(current_length==0){
        res = x
      } else{
        res <- list(even=do.call(rbind,x[seq(2,current_length,by=2)]),
                    odd=do.call(rbind,x[seq(1,current_length,by=2)])
    )
        return(res)
      }
    }
    )


    > listy2
    $`1`
    list()

    $`2`
    $`2`$even
                 a3         a4
    b.1 0.009495756 0.51425114
    b.2 0.232550506 0.69359129
    b.3 0.666083758 0.54497484
    d.1 0.186722790 0.30269337
    d.2 0.232225911 0.15904600
    d.3 0.316612455 0.03999592

    $`2`$odd
               a1        a2
    a.1 0.1137034 0.6233794
    a.2 0.6222994 0.8609154
    a.3 0.6092747 0.6403106
    c.1 0.2827336 0.8372956
    c.2 0.9234335 0.2862233
    c.3 0.2923158 0.2668208


Edit with very much the same structure, but bind_rows to deal with more types inside the dataframe.

listy3 <- lapply(listy, function(x){ 
#get length 
current_length=length(x) 
if(current_length==0){ 
res = x 
} else{ 
res <- list(even=bind_rows(x[seq(2,current_length,by=2)]), 
odd=bind_rows(x[seq(1,current_length,by=2)]) 
# odd=do.call(bind_rows,x[seq(1,current_length,by=2)]) 
) 
return(res) 
} 
} 
)

当然,“rbind”应该很容易替换为“bind_rows”。 - Heroka
你如何将这个结果扩展到超过2个项目的列表上?使用完全相同的结构(奇数和偶数)和空元素。 - erasmortg
我认为它应该已经适用于更长的列表。你试过了吗? - Heroka
是的,对于长度为2的列表效果很好。对于其他更长但结构相似的列表,我会得到这个错误:Error in [<-.ts(tmp, ri, value = c(155.363636363636, 155.363636363636, : 只允许替换元素。 - erasmortg
你能发布一些数据吗?我们说的是一些更长的列表,其中包含一些空元素和一些包含多个(但是偶数个)数据框的元素,对吧? - Heroka
显示剩余3条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接