115得票11回答
Python中的主成分分析

我想使用主成分分析(PCA)进行降维。NumPy或SciPy中已经有了它吗?还是我需要使用numpy.linalg.eigh自己编写代码? 我不想只使用奇异值分解(SVD),因为我的输入数据非常高维(~460个维度),所以我认为计算协方差矩阵的特征向量会比SVD更快。 我希望找到一个现成的...

101得票5回答
使用sklearn中PCA的explained_variance_ratio_属性恢复特征名称

我正在尝试从使用scikit-learn进行的PCA中恢复,确定哪些特征是相关的。 IRIS数据集是一个经典例子。import pandas as pd import pylab as pl from sklearn import datasets from sklearn.decomposi...

80得票11回答
Python中的主成分分析(PCA)

我有一个 (26424 x 144) 的数组,想使用Python对其执行PCA。然而,网络上没有特定的位置来解释如何完成此任务(有一些网站只是按照自己的方式执行PCA - 没有通用的方法可供查找)。任何能提供任何形式帮助的人都将是伟大的。

79得票3回答
PCA分析后的特征/变量重要性

我对原始数据集进行了PCA分析,并从通过PCA转换的压缩数据集中选择了要保留的PC数量(它们解释了近94%的方差)。现在我正在努力确定在缩小的数据集中重要的原始特征。如何找出在降维后剩余的主成分中哪些特征是重要的,哪些是不重要的?以下是我的代码:from sklearn.decompositi...

68得票2回答
59得票3回答
从sklearn PCA中获取特征值和特征向量

如何获取PCA应用程序的特征值和特征向量? from sklearn.decomposition import PCA clf=PCA(0.98,whiten=True) #converse 98% variance X_train=clf.fit_transform(X_trai...

48得票11回答
引发LinAlgError(“SVD未收敛”)LinAlgError:在matplotlib pca确定中,SVD未收敛。

代码: import numpy from matplotlib.mlab import PCA file_name = "store1_pca_matrix.txt" ori_data = numpy.loadtxt(file_name,dtype='float', comments='#...

46得票5回答
选择数据框中的多个奇数或偶数列/行

R中有没有一种方法可以选择许多非连续的即奇数或偶数行/列? 我正在绘制我的主成分分析负荷图。 我有84行数据,按如下顺序排列:x_1 y_1 x_2..... x_42 y_42 目前,我正在创建x和y负荷图数据框,如下所示:data.pc = princomp(as.matrix(da...

46得票3回答
Python scikit learn中的pca.explained_variance_ratio_截断。

选择主成分的数量(k)时,我们选择最小值,以便保留例如99%的方差。但是,在Python Scikit learn中,我不确定是否等于“保留了99%的方差”?有人能解释一下吗?谢谢。 Python Scikit learn PCA手册在此处 http://scikit-learn.or...

42得票8回答
使用ggplot2绘制PCA双标图

我想知道是否可以使用ggplot2绘制pca biplot结果。假设我想要使用ggplot2显示以下biplot结果。fit <- princomp(USArrests, cor=TRUE) summary(fit) biplot(fit) 任何帮助将不胜感激。谢谢。