选择C和gamma值

Question

9

你好，我正在使用SMO进行SVM分类，其中我的内核是RBF，现在我想使用网格搜索和交叉验证选择c和sigma值。由于我对内核函数很新，请您提供一步一步的帮助。

- pradeep deep

4个回答

4

阅读徐志伟、张智崇和林智仁的《支持向量分类实用指南》。他们解决了这个确切问题，并解释了进行参数选择的网格搜索方法。http://www.csie.ntu.edu.tw/~cjlin/papers/guide/guide.pdf

- karenu

1

我只是想对larsmans的回答稍作解释。

C参数是正则化/松弛参数。它较小的值会使权重变小。随着C变得越来越大，权重的允许范围也变得更宽。因此，更大的C值增加了分类错误的惩罚，从而减少了训练数据的分类误差率（这可能导致过度拟合）。随着C的增加，你的训练时间和支持向量数量也会增加。

你也可能会发现阅读将SVM扩展为软边界分类器 by K.K. Chin有用。

- Neeraj Bhatnagar

0

您还可以使用统一设计模型选择来减少需要检查的元组数量。解释它的论文是“通过统一设计的支持向量机模型选择”由黄建明撰写。

一些Python实现已经存在于ssvm 0.2中。

- eSadr

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Fred Foo · Accepted Answer

选择一些你认为有趣的C和sigma值。例如，C = {1, 10, 100, 1000}，sigma = {.01, .1, 1}（这只是举个例子）。
将训练集分成k个部分（例如10个），最好是按照分层的方式进行。
循环遍历所有C和sigma值对。
1. 循环遍历你的训练集的所有k个部分。保留第k个部分。在其它所有部分上训练分类器，然后在保留的部分上进行测试。
2. 跟踪一些分数（准确度、F1或者任何你想优化的指标）。
通过刚刚计算的分数返回C和sigma的最佳性能值对。