在哪些情况下最适合使用具有线性核的支持向量机（SVM）？

Question

在哪些情况下最适合使用具有线性核的支持向量机（SVM）？

machine-learningclassificationsvmmathematical-optimization

20

我目前正在研究支持向量机（SVM），想知道使用线性内核的SVM应用是什么。在我看来，它一定是用于解决线性优化问题的某个应用。这个理解正确吗？

感谢你的回答！

- Carol.Kar

5个回答

4

线性核函数有一些优点，但在我看来最显著的优点可能是它通常比非线性核函数（如RBF）更快地训练。

如果你的数据集大小以GB为单位，你会发现训练时间差异是巨大的（几分钟 vs 几小时）。

- Pedrom

4

线性核函数最适用于线性可分的数据。想象一下，如果您的数据集只有2个特征和2个类别，那么如果您将数据集样本在图表中绘制出来，使用这2个特征作为X轴和Y轴，您就可以看到不同类别的样本相对位置。

如果很容易画出一个将两个类别分开的直线，那么线性核函数就非常适合完成这项工作：

enter image description here

当然，这也适用于许多特征，而不仅仅是两个，形成多维空间。但是，如果您的数据不是线性可分的，则需要使用像RBF或多项式这样的核函数将样本映射到另一个维度空间。

而且，由于线性核不执行任何映射，所以通常比其他核函数更快地训练分类器。

- Anoyz

3

使用线性核的支持向量机确实是最简单的分类器之一，但当数据分布为线性可分时，如果我们获得非常高的性能准确度也不足为奇。

从这个意义上讲，我认为你的观点是正确的。但是，您需要认识到SVM的强大之处在于使用更复杂的非线性核（例如RBF）进行扩展。

选择分类器的一个链接。

- Ray

3

支持向量机（SVM）是一种应用线性核的分类或回归算法。当数据拥有线性决策边界或线性拟合时，SVM 会表现得最好，因此使用线性核。

- aplassard

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- lennon310 · Accepted Answer

还有一点需要补充的是：线性SVM比非线性SVM更不容易过拟合。您需要根据实际情况决定选择哪种内核：如果您的特征数量相对于训练样本非常大，只需使用线性内核；如果您的特征数量较小但训练样本很大，您也可能需要使用线性内核，但请尝试添加更多特征；如果您的特征数量很少（10^0 - 10^3），而样本数量较中等（10^1 - 10^4），则使用高斯内核将更好。

据我所知，具有线性内核的SVM通常与逻辑回归相当。