SVM多类文本分类

4

我希望对新闻数据集进行分类,训练数据集已用IPTC主题代码(分层分类)进行分类。

在我的项目中,我应该使用SVM。

我已经完成了所有的特征提取、词干提取和停用词去除等工作...

我已经几乎拥有了SVM多类文件所需的格式:

它看起来像:

category  feature:value feature:value feature:value

我不知道如何使用svmmulticlass。

我也听说过one-against-all,但不知道它是什么。

请告诉我在哪里可以找到关于它的教程,或者如何使用它。

谢谢。

2个回答

4

"one-against-all"是一种用于训练SVM进行多标签分类的技术。例如,如果你有“n”个类别标签:那么你就需要创建“n”个SVM,并将每个SVM分别训练为正标签和其他所有标签为负标签。

这就是“one-against-all”的含义。你可以访问http://svmlight.joachims.org/svm_multiclass.html并使用其中的多类别SVM。


1

你应该先阅读支持向量分类实用指南

一对多是一种将SVM(一种自然的二元分类方法)转换为多类分类器的方法。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接