我对机器学习还很陌生,刚刚接触到主成分分析作为一种降维方法。我不理解的是,在什么情况下PCA比仅删除模型中的某些特征更好?如果目标是获得低维数据,为什么我们不只是将相关的特征分组并保留每个组中的一个单一特征呢?
我对机器学习还很陌生,刚刚接触到主成分分析作为一种降维方法。我不理解的是,在什么情况下PCA比仅删除模型中的某些特征更好?如果目标是获得低维数据,为什么我们不只是将相关的特征分组并保留每个组中的一个单一特征呢?
在IT技术中,特征降维(如PCA)和特征选择(你所描述的)有根本性的区别。关键的区别在于,特征降维(PCA)通过对所有原始维度的某些投影进行线性组合来将数据映射到较低的维度。因此,最终的数据嵌入包含了所有特征的信息。如果您执行特征选择,则会丢弃信息,完全丢失其中存在的任何内容。此外,PCA保证您保留给定数据方差的一部分。