让我们考虑两个矩阵A和B。A是B的子集。如何在矩阵B中找到A的每一行的索引? 这里有一个可重现的例子:
set.seed(30)
B <- matrix(rnorm(n =30,mean = 0), ncol=3)
A <- subset(B, B[,1] > 1)
目标是找到索引idx
,在这种情况下为第4行和第5行。
apply
循环应该可以解决这个问题。apply(A, 1, function(a)
which(apply(B, 1, function(b) all(b==a)))
)
# [1] 4 5
colSums
函数。apply(A, 1, function(a)
which(colSums(t(B) == a) == ncol(B)))
# [1] 4 5
或者,你可以这样做:
transform(A, idx = 1 * duplicated(rbind(A, B))[-seq_len(nrow(A))])
> match(apply(A, 1, paste, collapse="\b"), apply(B, 1, paste, collapse="\b"))
[1] 4 5
这种方法略有不同,它依赖于矩阵是向量的事实,如果你有data.frames
,它将无法工作:
which( B %in% A , arr.ind=TRUE )[1:nrow(A)]
#[1] 4 5
如果您有非常大的矩阵并希望更高效一些,可以在子集上使用%in%
:
which( B[1:nrow(B)] %in% A[1:nrow(A)] , arr.ind=TRUE )
但我不认为这会有太大的区别,除非是在非常大的矩阵中。
如果您将数据作为data.frames
,您可以通过仅传递第一列到which
来执行相同的操作:
A <- data.frame(A)
B <- data.frame(B)
which( B$X1 %in% A$X1 )
#[1] 4 5