使用相关矩阵对大型稀疏矩阵进行PCA

3
我有一个庞大的(500k x 500k),稀疏矩阵。我想获得它的主成分(事实上,即使仅计算最大的PC也可以)。随机PCA非常有效,但它本质上是在寻找协方差矩阵的特征向量而不是相关矩阵。有没有什么包可以使用大型稀疏矩阵的协方差矩阵来找到PCA?最好用Python,但MATLAB和R也可以。
(供参考,类似的问题在这里提出:https://dev59.com/_mgv5IYBdhLWcg3wSewf,但其方法涉及协方差矩阵)。
2个回答

0

它们不是同一件事吗? 就我所理解的而言,相关矩阵只是由每个变量的标准偏差乘积归一化的协方差矩阵。 而且,如果我没记错的话,PCA中不是存在一个缩放歧义吗?


0
你有没有尝试过在R中使用irlba包?"IRLBA包是该方法的R语言实现。使用它,您可以计算非常大规模数据的部分SVD和主成分分析。该软件包与稀疏矩阵以及Bigmemory软件包提供的其他矩阵类一起使用效果很好。" 您可以在这里查看详细信息。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接