我对机器学习中的特征缩放概念还不熟悉,阅读后得知,当某个特征比其他特征的范围要大时,进行特征缩放会很有用。但如果我选择对训练数据进行特征缩放:
- 我是否只需要缩放那个范围很大的特征?
- 如果我对整个训练数据的
X
进行缩放,是否也需要对训练数据和测试数据的y
进行缩放?
我对机器学习中的特征缩放概念还不熟悉,阅读后得知,当某个特征比其他特征的范围要大时,进行特征缩放会很有用。但如果我选择对训练数据进行特征缩放:
X
进行缩放,是否也需要对训练数据和测试数据的y
进行缩放?是的,您可以对单个特征进行缩放。您可以将缩放解释为一种使每个特征具有相同重要性的方法。例如,假设您拥有有关人员的数据,并通过两个特征描述您的示例:身高和体重。如果您用米来测量身高,用千克来测量体重,则在计算两个示例之间的距离时,k-最近邻分类器很可能仅基于体重做出决策。在这种情况下,您可以将其中一个特征缩放到与另一个特征相同的范围内。通常,我们将所有特征缩放到相同的范围内(例如0-1)。此外,请记住,用于缩放训练数据的所有值都必须用于缩放测试数据。
至于因变量y
,您不需要对其进行缩放。