通过以下链接,我得出了一些想法。我想问一下,我的做法是正确的还是错误的。如果我走错了路,请指导我。
链接
使用libsvm进行文本分类c#
如何使用libsvm进行文本分类?
我的方法
首先计算每个训练集中单词的数量
为每个单词创建一个映射列表
例如
sample word count form training set
|-----|-----------|
| | counts |
|-----|-----|-----|
|text | +ve | -ve |
|-----|-----|-----|
|this | 3 | 3 |
|forum| 1 | 0 |
|is | 10 | 12 |
|good | 10 | 5 |
|-----|-----|-----|
正面训练数据
this forum is good
那么训练集也会是这样
+1 1:3 2:1 3:10 4:10
这些都是我从上面链接中收到的内容。请帮助我。