得票数最多 'pca' 问题 - 第5页

我正在使用这里的输入数据（请参见第3.1节）。我试图使用scikit-learn复现它们的协方差矩阵、特征值和特征向量。然而，我无法复现数据源中呈现的结果。我还在其他地方看到过这个输入数据，但我无法确定是scikit-learn、我的步骤还是数据源的问题。data = np.array([[2...

scikit-learnstatisticslinear-algebrapca

14得票1回答

如何将Spark DataFrame转换为RDD MLlib LabeledPoints？

我尝试对我的数据应用PCA，然后对转换后的数据应用RandomForest。但是，PCA.transform(data) 给了我一个 DataFrame，而我需要一个mllib LabeledPoints来提供给我的RandomForest。我该怎么做？我的代码： import org....

scalaapache-sparkrddpcaapache-spark-mllib

14得票3回答

Sklearn中的PCA内存错误：备选降维方法？

我正在使用Sklearn中的PCA来降维一个非常大的矩阵，但是它会产生内存错误（所需的RAM超过128GB）。我已经设置了copy=False，并且我正在使用计算量较小的随机PCA。是否有解决方法？如果没有，还有哪些需要更少内存的降维技术可用。谢谢。更新：我要对这个矩阵进行PCA...

pythonmultidimensional-arrayscikit-learnpca

14得票2回答

大数据上的增量PCA

我刚刚尝试使用sklearn.decomposition的IncrementalPCA，但它像PCA和RandomizedPCA一样抛出了MemoryError。我的问题是，我尝试加载的矩阵太大无法放入RAM中。现在它作为形状为~（1000000,1000）的数据集存储在hdf5数据库中，因此...

pythonscikit-learnbigdatahdf5pca

13得票5回答

如何实现ZCA白化？Python

我正在尝试实现 ZCA白化，并找到一些文章来进行实现，但它们有点令人困惑..有人能帮忙吗？非常感谢任何提示或帮助！这是我读过的文章： http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf http://bbabenko.tu...

pythonpcacorrelatedimage-preprocessing

12得票1回答

scikit-learn中TruncatedSVD的解释方差比率未按降序排列

TruncatedSVD的解释方差比并不像sklearn的PCA那样按降序排列。我查看了源代码，发现它们使用了不同的计算解释方差比的方法： TruncatedSVD：U, Sigma, VT = randomized_svd(X, self.n_components, ...

pythonscikit-learnpcasvd