得票数最多 'pca' 问题 - 第2页

关联标签

34得票2回答

sklearn中的PCA - 如何解释pca.components_

我使用这段简单的代码对一个包含10个特征的数据框进行了PCA分析： pca = PCA() fit = pca.fit(dfPca) pca.explained_variance_ratio_ 的结果显示： array([ 5.01173322e-01, 2.98421951e-...

pythonmachine-learningmathscikit-learnpca

34得票2回答

R函数prcomp在遇到NA值时会失败，即使允许存在NA值。

我正在使用prcomp函数来计算前两个主成分。但是，我的数据中有一些NA值，因此该函数会抛出一个错误。即使在帮助文件?prcomp中提到了na.action定义，看起来也没有起作用。以下是我的示例：d <- data.frame(V1 = sample(1:100, 10), V2 ...

rpcana

32得票3回答

使用sklearn计算因子载荷

我希望能够在Python中获得个体变量和主成分之间的相关性。我正在使用sklearn中的PCA。在对数据进行分解后，我不明白如何获得载荷矩阵？这是我的代码。iris = load_iris() data, y = iris.data, iris.target pca = PCA(n_comp...

pythonscikit-learnpca

31得票2回答

scikit-learn中的PCA投影和重构

我可以通过以下代码在scikit中进行PCA： X_train有279180行和104列。from sklearn.decomposition import PCA pca = PCA(n_components=30) X_train_pca = pca.fit_transform(X_tra...

pythonmachine-learningscikit-learnpca

28得票1回答

R对稀疏矩阵的内部处理

我一直在比较Python和R中几个PCA实现的性能，并注意到一个有趣的行为：虽然似乎无法在Python中计算稀疏矩阵的PCA（唯一的方法是scikit-learn的TruncatedSVD，但它不支持所需的均值居中以等效于PCA的协方差解决方案。他们的论点是，这将破坏矩阵的稀疏属性。 Fa...

pythonrscikit-learnsparse-matrixpca

27得票3回答

如何使用scikit-learn的PCA进行特征降维并知道哪些特征被舍弃了。

我试图在一个大小为m x n的矩阵上运行PCA，其中m是特征数量，n是样本数量。假设我想保留具有最大方差的nf个特征。使用scikit-learn，我可以这样做:from sklearn.decomposition import PCA nf = 100 pca = PCA(n_comp...

pythonmachine-learningscikit-learnpcafeature-selection

27得票2回答

使用PCA对word2vec嵌入进行降维处理

我正在尝试复现这篇论文的结果：https://arxiv.org/pdf/1607.06520.pdf 具体来说，是这个部分：为了确定性别子空间，我们取了十个性别对差向量并计算其主成分（PCs）。如图6所示，有一个方向能够解释这些向量中大部分的变化。第一个特征值明显比其他的大。 ...

pythonscikit-learnnlppcaword2vec

26得票4回答

Pyspark和PCA：我如何提取此PCA的特征向量？我如何计算它们解释了多少方差？

我正在使用 pyspark（使用 spark ml 库）和 PCA 模型来降低 Spark DataFrame 的维度，代码如下：pca = PCA(k=3, inputCol="features", outputCol="pca_features") ...

apache-sparkapache-spark-sqlpysparkpcaapache-spark-ml

26得票4回答

使用Numpy(np.linalg.svd)进行奇异值分解

我正在阅读 Abdi & Williams (2010) 的 "主成分分析"，并尝试重新使用SVD来获得进一步PCA的值。文章指出以下SVD： X = P D Q^t 我将我的数据加载到 np.array X 中。 X = np.array(data) P, D, Q = n...

pythonnumpypca

25得票2回答

使用sklearn对大型稀疏矩阵执行PCA

我正在尝试在巨大的稀疏矩阵上应用PCA，在下面的链接中指出，sklearn的随机PCA可以处理scipy稀疏格式的稀疏矩阵。对非常大的稀疏矩阵应用PCA 但是，我总是遇到错误。有人能指出我做错了什么吗。输入矩阵'X_train'包含float64数字：>>>type(...

pythonscikit-learnsparse-matrixpcasvd