我目前正在研究支持向量机(SVM),想知道使用线性内核的SVM应用是什么。在我看来,它一定是用于解决线性优化问题的某个应用。这个理解正确吗?
感谢你的回答!
我目前正在研究支持向量机(SVM),想知道使用线性内核的SVM应用是什么。在我看来,它一定是用于解决线性优化问题的某个应用。这个理解正确吗?
感谢你的回答!
还有一点需要补充的是:线性SVM比非线性SVM更不容易过拟合。您需要根据实际情况决定选择哪种内核:如果您的特征数量相对于训练样本非常大,只需使用线性内核;如果您的特征数量较小但训练样本很大,您也可能需要使用线性内核,但请尝试添加更多特征;如果您的特征数量很少(10^0 - 10^3),而样本数量较中等(10^1 - 10^4),则使用高斯内核将更好。
据我所知,具有线性内核的SVM通常与逻辑回归相当。
线性核函数有一些优点,但在我看来最显著的优点可能是它通常比非线性核函数(如RBF)更快地训练。
如果你的数据集大小以GB为单位,你会发现训练时间差异是巨大的(几分钟 vs 几小时)。
线性核函数最适用于线性可分的数据。想象一下,如果您的数据集只有2个特征和2个类别,那么如果您将数据集样本在图表中绘制出来,使用这2个特征作为X轴和Y轴,您就可以看到不同类别的样本相对位置。
如果很容易画出一个将两个类别分开的直线,那么线性核函数就非常适合完成这项工作:
当然,这也适用于许多特征,而不仅仅是两个,形成多维空间。但是,如果您的数据不是线性可分的,则需要使用像RBF或多项式这样的核函数将样本映射到另一个维度空间。
而且,由于线性核不执行任何映射,所以通常比其他核函数更快地训练分类器。
使用线性核的支持向量机确实是最简单的分类器之一,但当数据分布为线性可分时,如果我们获得非常高的性能准确度也不足为奇。
从这个意义上讲,我认为你的观点是正确的。但是,您需要认识到SVM的强大之处在于使用更复杂的非线性核(例如RBF)进行扩展。
选择分类器的一个链接。
支持向量机(SVM)是一种应用线性核的分类或回归算法。当数据拥有线性决策边界或线性拟合时,SVM 会表现得最好,因此使用线性核。