你好,我正在使用SMO进行SVM分类,其中我的内核是RBF,现在我想使用网格搜索和交叉验证选择c和sigma值。由于我对内核函数很新,请您提供一步一步的帮助。
你好,我正在使用SMO进行SVM分类,其中我的内核是RBF,现在我想使用网格搜索和交叉验证选择c和sigma值。由于我对内核函数很新,请您提供一步一步的帮助。
阅读徐志伟、张智崇和林智仁的《支持向量分类实用指南》。他们解决了这个确切问题,并解释了进行参数选择的网格搜索方法。http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf
我只是想对larsmans的回答稍作解释。
C参数是正则化/松弛参数。它较小的值会使权重变小。随着C变得越来越大,权重的允许范围也变得更宽。因此,更大的C值增加了分类错误的惩罚,从而减少了训练数据的分类误差率(这可能导致过度拟合)。随着C的增加,你的训练时间和支持向量数量也会增加。
你也可能会发现阅读将SVM扩展为软边界分类器 by K.K. Chin有用。