fooB <- foo %*% foo
第二次,阈值更低......1的数量:30,384,683...0的数量:3,886,998,238。这些数字的总和再次是62589^2,因此是真正的二元化。Rdata对象为84Mb。执行与上面相同的乘法步骤仍在一个小时后计算。
最新矩阵中1的增加是否会如此大地增加文件大小和处理时间?
谢谢阅读。
编辑:对于相同的计算到第二个矩阵的最终时间为65分钟。
编辑2:执行is()的结果为:矩阵数组结构向量。
fooB <- foo %*% foo
第二次,阈值更低......1的数量:30,384,683...0的数量:3,886,998,238。这些数字的总和再次是62589^2,因此是真正的二元化。Rdata对象为84Mb。执行与上面相同的乘法步骤仍在一个小时后计算。
最新矩阵中1的增加是否会如此大地增加文件大小和处理时间?
谢谢阅读。
编辑:对于相同的计算到第二个矩阵的最终时间为65分钟。
编辑2:执行is()的结果为:矩阵数组结构向量。
这里有一个可重现的例子,可能有助于处理来自Matrix包的二进制稀疏矩阵的内存大小和处理时间:
n <- 62589
N1 <- 425491
require(Matrix)
foo <- sparseMatrix(i=sample(n, N1, TRUE), j=sample(n, N1, TRUE), dims=c(n, n))
print(object.size(foo), units="Mb")
#1.9 Mb
sum(foo)
#[1] 425464
请注意,由于抽样可能会产生一些重复的配对(i,j),因此上面的数字稍微小于N1。
平方:
system.time(fooB <- foo %*% foo)
# user system elapsed
# 0.39 0.03 0.42
print(object.size(fooB), units="Mb")
#11.3 Mb
sum(fooB)
#[1] 2892234
立方化:
system.time(fooC <- fooB %*% foo)
# user system elapsed
# 2.74 0.11 2.87
print(object.size(fooC), units="Mb")
#75 Mb
sum(fooC)
#[1] 19610641
sparse.matrix来查看区别呢? - agstudyis()结果和您不可能使用密集矩阵来完成此操作的事实)。因此,这并不特别令人惊讶。这是一个相当困难的问题!我不知道进行填充减少置换是否很简单,但只有在您要对具有相同结构的多个矩阵进行乘法运算时才有帮助。另一种可能性是尝试进行并行计算-我不知道是否有用于稀疏、并行二进制矩阵乘法的易于使用的BLAS接口... - Ben Bolker