我有一个包含49个变量和400万行的数据框。我想要计算一个49 x 49的相关矩阵。所有的列都是数值型。
以下是一个样例:
我使用了标准的
以下是一个样例:
df <- data.frame(replicate(49,sample(0:50,4000000,rep=TRUE)))
我使用了标准的
cor
函数。cor_matrix <- cor(df, use = "pairwise.complete.obs")
这个计算太慢了。我有16GB内存和一颗i5单核2.60GHz的处理器。
有没有办法让我的台式机运算更快?
use = "pairwise.complete.obs"
。在我的系统上(测试了12列),这需要的时间是use = "everything"
的五倍。 - Roland