假设我在R语言中有两个列表,长度不一定相等,例如:
a <- list('a.1','a.2', 'a.3')
b <- list('b.1','b.2', 'b.3', 'b.4')
如何构建一个交错元素列表的最佳方式,其中一旦添加了较短列表的元素,剩余的长列表元素将附加在末尾?例如:
interleaved <- list('a.1','b.1','a.2', 'b.2', 'a.3', 'b.3','b.4')
不使用循环。我知道mapply适用于两个列表长度相等的情况。
假设我在R语言中有两个列表,长度不一定相等,例如:
a <- list('a.1','a.2', 'a.3')
b <- list('b.1','b.2', 'b.3', 'b.4')
如何构建一个交错元素列表的最佳方式,其中一旦添加了较短列表的元素,剩余的长列表元素将附加在末尾?例如:
interleaved <- list('a.1','b.1','a.2', 'b.2', 'a.3', 'b.3','b.4')
不使用循环。我知道mapply适用于两个列表长度相等的情况。
这里有一种方法:
idx <- order(c(seq_along(a), seq_along(b)))
unlist(c(a,b))[idx]
# [1] "a.1" "b.1" "a.2" "b.2" "a.3" "b.3" "b.4"
正如@James所指出的那样,由于你需要返回一个列表,你应该这样做:
(c(a,b))[idx]
在调查一个类似问题时,我发现这个由Gabor Grothendieck(即@GGrothendieck?)提出的解决方案非常优美,适用于某些情况:
c(rbind(a,b))
当a
和b
都是列表,或者都是向量时,这个方法同样适用。它不能精确解决OP的问题,因为当a
和b
的长度不同时,它会重复使用较短序列的元素并打印警告。然而,由于这个方法简单而优雅,并且提供了一个答案给一个非常相似的问题--一些人(比如我)在查找这个页面时得到的答案--所以值得将其作为一个答案添加进来。
这里有一个使用 ggplot2 中的 interleave
函数的选项。我相信这可以得到改进,但这是一个开始:
require(ggplot2)
Interleave <- function(x,y){
v <- list(x,y)
lengths <- sapply(v,length)
mn <- min(lengths)
v <- v[order(lengths)]
c(ggplot2:::interleave(v[[1]],v[[2]][seq_len(mn)]),v[[2]][(mn+1):length(v[[2]])])
}
Interleave(a,b)
Interleave(b,a)
v[[2]]
的索引,从而避免出现这种退化情况。interleave(a, b)
# unlist(interleave(a, b))
# [1] "a.1" "b.1" "a.2" "b.2" "a.3" "b.3" "b.4"
interleave <- function(a, b) {
shorter <- if (length(a) < length(b)) a else b
longer <- if (length(a) >= length(b)) a else b
slen <- length(shorter)
llen <- length(longer)
index.short <- (1:slen) + llen
names(index.short) <- (1:slen)
lindex <- (1:llen) + slen
names(lindex) <- 1:llen
sindex <- 1:slen
names(sindex) <- 1:slen
index <- c(sindex, lindex)
index <- index[order(names(index))]
return(c(a, b)[index])
}
a <- list('a.1','a.2', 'a.3')
b <- list('b.1','b.2', 'b.3', 'b.4')
interleave <- function(a, b) {
mlab <- min(length(a), length(b))
seqmlab <- seq_len(mlab)
c(rbind(a[seqmlab], b[seqmlab]), a[-seqmlab], b[-seqmlab])
}
interleave(a, b)
来自 http://r.789695.n4.nabble.com/Interleaving-elements-of-two-vectors-tp795123p1691409.html
这比@Arun稍微快一点:
unlist
,而是只使用c(a,b)[idx]
可能更好,因为通常情况下,使用unlist
会破坏复杂对象的数据结构。 - James