我将使用libSVM。 假设我的特征值格式如下:
instance1 : f11, f12, f13, f14
instance2 : f21, f22, f23, f24
instance3 : f31, f32, f33, f34
instance4 : f41, f42, f43, f44
..............................
instanceN : fN1, fN2, fN3, fN4
我认为可以应用两种缩放方法。
将每个实例向量进行缩放,使得每个向量具有零均值和单位方差。
( (f11, f12, f13, f14) - mean((f11, f12, f13, f14) ). /std((f11, f12, f13, f14) )
将上述矩阵的每一列缩放到一个范围内,例如[-1, 1]
根据我使用RBF核函数(libSVM)的实验结果,我发现第二种缩放方法(2)可以提高结果约10%。但我不理解为什么(2)会给我带来更好的结果。
有人能解释一下为什么要进行缩放以及第二种选项为什么能够提高结果吗?