在哪些情况下最适合使用具有线性核的支持向量机(SVM)?

20

我目前正在研究支持向量机(SVM),想知道使用线性内核的SVM应用是什么。在我看来,它一定是用于解决线性优化问题的某个应用。这个理解正确吗?

感谢你的回答!

5个回答

25

还有一点需要补充的是:线性SVM比非线性SVM更不容易过拟合。您需要根据实际情况决定选择哪种内核:如果您的特征数量相对于训练样本非常大,只需使用线性内核;如果您的特征数量较小但训练样本很大,您也可能需要使用线性内核,但请尝试添加更多特征;如果您的特征数量很少(10^0 - 10^3),而样本数量较中等(10^1 - 10^4),则使用高斯内核将更好。

据我所知,具有线性内核的SVM通常与逻辑回归相当。


4

线性核函数有一些优点,但在我看来最显著的优点可能是它通常比非线性核函数(如RBF)更快地训练。

如果你的数据集大小以GB为单位,你会发现训练时间差异是巨大的(几分钟 vs 几小时)。


4

线性核函数最适用于线性可分的数据。想象一下,如果您的数据集只有2个特征和2个类别,那么如果您将数据集样本在图表中绘制出来,使用这2个特征作为X轴和Y轴,您就可以看到不同类别的样本相对位置。

如果很容易画出一个将两个类别分开的直线,那么线性核函数就非常适合完成这项工作:

enter image description here

当然,这也适用于许多特征,而不仅仅是两个,形成多维空间。但是,如果您的数据不是线性可分的,则需要使用像RBF或多项式这样的核函数将样本映射到另一个维度空间。

而且,由于线性核不执行任何映射,所以通常比其他核函数更快地训练分类器。


3

使用线性核的支持向量机确实是最简单的分类器之一,但当数据分布为线性可分时,如果我们获得非常高的性能准确度也不足为奇。

从这个意义上讲,我认为你的观点是正确的。但是,您需要认识到SVM的强大之处在于使用更复杂的非线性核(例如RBF)进行扩展。

选择分类器的一个链接。


3

支持向量机(SVM)是一种应用线性核的分类或回归算法。当数据拥有线性决策边界或线性拟合时,SVM 会表现得最好,因此使用线性核。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接