我是机器学习新手,开始跟随Udacity的机器学习入门课程。
当我在跟随支持向量机时,出现了“C和Gamma
”这个概念。我做了一些调查,发现以下内容:
C- 高C会尝试最小化训练数据的误分类,而低值则会尝试保持平滑分类。这对我来说有意义。
Gamma- 我无法理解这个。
有人可以用通俗易懂的语言为我解释一下吗?
我是机器学习新手,开始跟随Udacity的机器学习入门课程。
当我在跟随支持向量机时,出现了“C和Gamma
”这个概念。我做了一些调查,发现以下内容:
C- 高C会尝试最小化训练数据的误分类,而低值则会尝试保持平滑分类。这对我来说有意义。
Gamma- 我无法理解这个。
有人可以用通俗易懂的语言为我解释一下吗?
当你使用SVM时,必须使用其中之一的核函数:线性、多项式或RBF=径向基函数(也称为高斯核)或其他。后者是
K(x,x') = exp(-gamma * ||x-x'||^2)
这段文本中的gamma值会直接影响高斯函数的“钟形曲线”的宽度,gamma值越大,“钟形曲线”的宽度越窄。
我相信随着课程的深入学习,您将更多地了解到这种“核函数技巧”。
-C参数:C决定了允许在不同类别中放置多少数据样本。如果将C的值设置为较低的值,则异常值的概率会增加,并找到一般的决策边界。如果将C的值设置得高,那么决策边界会更加仔细地被找到。
C用于软间隔,需要理解松弛变量。
-软间隔分类器:
-松弛变量 确定了要调整多少空隙。
gamma参数:gamma确定单个数据样本施加影响的距离。也就是说,gamma参数可以调整决策边界的曲率。