支持向量机:C和Gamma是什么?

5

我是机器学习新手,开始跟随Udacity的机器学习入门课程

当我在跟随支持向量机时,出现了“C和Gamma”这个概念。我做了一些调查,发现以下内容:

C- 高C会尝试最小化训练数据的误分类,而低值则会尝试保持平滑分类。这对我来说有意义。

Gamma- 我无法理解这个。

有人可以用通俗易懂的语言为我解释一下吗?


请参考以下链接了解有关支持向量机中的C和gamma的内容:https://www.quora.com/What-are-C-and-gamma-with-regards-to-a-support-vector-machine - tidy
3个回答

7

当你使用SVM时,必须使用其中之一的核函数:线性、多项式或RBF=径向基函数(也称为高斯核)或其他。后者是

K(x,x') = exp(-gamma * ||x-x'||^2) 

这段文本中的gamma值会直接影响高斯函数的“钟形曲线”的宽度,gamma值越大,“钟形曲线”的宽度越窄。

我相信随着课程的深入学习,您将更多地了解到这种“核函数技巧”。


1
虽然您的答案是被接受的答案,但您并没有像OP要求的那样用通俗易懂的语言进行解释。 - Crabigator360

7
直观地说,gamma参数定义了一个单个训练样本的影响范围,低值意味着“远”,高值则表示“近”。Gamma参数可以被看作是模型选择支持向量时样本影响半径的倒数。 C参数权衡了对训练样本分类的错误和决策面简单性之间的关系。小的C会使决策面平滑,而大的C则旨在通过给予模型选择更多样本作为支持向量的自由来正确分类所有训练样本。 http://scikit-learn.org/stable/auto_examples/svm/plot_rbf_parameters.html

6

-C参数:C决定了允许在不同类别中放置多少数据样本。如果将C的值设置为较低的值,则异常值的概率会增加,并找到一般的决策边界。如果将C的值设置得高,那么决策边界会更加仔细地被找到。

C用于软间隔,需要理解松弛变量。

-软间隔分类器:
Text

-松弛变量 Text 确定了要调整多少空隙。

gamma参数:gamma确定单个数据样本施加影响的距离。也就是说,gamma参数可以调整决策边界的曲率。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接