34得票2回答
sklearn中的PCA - 如何解释pca.components_

我使用这段简单的代码对一个包含10个特征的数据框进行了PCA分析: pca = PCA() fit = pca.fit(dfPca) pca.explained_variance_ratio_ 的结果显示: array([ 5.01173322e-01, 2.98421951e-...

34得票2回答
R函数prcomp在遇到NA值时会失败,即使允许存在NA值。

我正在使用prcomp函数来计算前两个主成分。但是,我的数据中有一些NA值,因此该函数会抛出一个错误。即使在帮助文件?prcomp中提到了na.action定义,看起来也没有起作用。 以下是我的示例:d <- data.frame(V1 = sample(1:100, 10), V2 ...

32得票3回答
使用sklearn计算因子载荷

我希望能够在Python中获得个体变量和主成分之间的相关性。 我正在使用sklearn中的PCA。在对数据进行分解后,我不明白如何获得载荷矩阵?这是我的代码。iris = load_iris() data, y = iris.data, iris.target pca = PCA(n_comp...

31得票2回答
scikit-learn中的PCA投影和重构

我可以通过以下代码在scikit中进行PCA: X_train有279180行和104列。from sklearn.decomposition import PCA pca = PCA(n_components=30) X_train_pca = pca.fit_transform(X_tra...

28得票1回答
R对稀疏矩阵的内部处理

我一直在比较Python和R中几个PCA实现的性能,并注意到一个有趣的行为: 虽然似乎无法在Python中计算稀疏矩阵的PCA(唯一的方法是scikit-learn的TruncatedSVD,但它不支持所需的均值居中以等效于PCA的协方差解决方案。 他们的论点是,这将破坏矩阵的稀疏属性。 Fa...

27得票3回答
如何使用scikit-learn的PCA进行特征降维并知道哪些特征被舍弃了。

我试图在一个大小为m x n的矩阵上运行PCA,其中m是特征数量,n是样本数量。 假设我想保留具有最大方差的nf个特征。使用scikit-learn,我可以这样做:from sklearn.decomposition import PCA nf = 100 pca = PCA(n_comp...

27得票2回答
使用PCA对word2vec嵌入进行降维处理

我正在尝试复现这篇论文的结果:https://arxiv.org/pdf/1607.06520.pdf 具体来说,是这个部分: 为了确定性别子空间,我们取了十个性别对差向量并计算其主成分(PCs)。如图6所示,有一个方向能够解释这些向量中大部分的变化。第一个特征值明显比其他的大。 ...

26得票4回答
Pyspark和PCA:我如何提取此PCA的特征向量?我如何计算它们解释了多少方差?

我正在使用 pyspark(使用 spark ml 库)和 PCA 模型来降低 Spark DataFrame 的维度,代码如下:pca = PCA(k=3, inputCol="features", outputCol="pca_features") ...

26得票4回答
使用Numpy(np.linalg.svd)进行奇异值分解

我正在阅读 Abdi & Williams (2010) 的 "主成分分析",并尝试重新使用SVD来获得进一步PCA的值。 文章指出以下SVD: X = P D Q^t 我将我的数据加载到 np.array X 中。 X = np.array(data) P, D, Q = n...

25得票2回答
使用sklearn对大型稀疏矩阵执行PCA

我正在尝试在巨大的稀疏矩阵上应用PCA,在下面的链接中指出,sklearn的随机PCA可以处理scipy稀疏格式的稀疏矩阵。 对非常大的稀疏矩阵应用PCA 但是,我总是遇到错误。有人能指出我做错了什么吗。 输入矩阵'X_train'包含float64数字:>>>type(...