Liblinear如何使用

Question

4

我在机器学习和文本挖掘方面还比较新手。我注意到了一个名为Liblinear的Ruby库https://github.com/tomz/liblinear-ruby-swig。

目前，我希望训练这个软件，以识别一段文本是否提到与自行车相关的任何内容。

请问有人可以指出我应该遵循哪些步骤（例如：如何预处理文本），分享资源，并最好分享一个简单的示例来帮助我入门吗？

非常感谢您的帮助！

- mabounassif

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Fred Foo · Accepted Answer

经典方法如下：

现在，要分类一个文档，请像步骤4那样将其向量化，并将其馈送给分类器以获取相关/不相关标签。将其与实际标签进行比较，以查看是否正确分类。使用这种简单方法应该能够获得至少80%的准确率。

要改进此方法，请用术语计数替换布尔值，除以文档长度进行归一化，或者更好地使用tf-idf分数。