我已经尝试了Orange框架进行朴素贝叶斯分类。
- 这些方法非常不直观,文档组织也非常混乱。这里有没有其他的框架可以推荐?
- 目前我主要使用
NaiveBayesian
。
我在考虑使用nltk的
NaiveClassification
,但是他们认为它不能处理连续变量。
我的选择有哪些?
我已经尝试了Orange框架进行朴素贝叶斯分类。
NaiveBayesian
。我在考虑使用nltk的NaiveClassification
,但是他们认为它不能处理连续变量。
我的选择有哪些?
这个链接可能是一个不错的起点。它提供了一个朴素贝叶斯分类器的完整源代码(包括文本解析器、数据存储和分类器)的 Python 实现。虽然它很完整,但也足够小,可以在一次会话中消化掉。我认为这段代码写得相当不错,并且有良好的注释。这是《集体智慧编程》一书的源代码文件之一。
要获取源代码,请单击该链接,下载并解压缩zip文件,从主文件夹“PCI_Code”转到“chapter 6”文件夹,其中有一个名为“docclass.py”的 Python 源代码文件。 这是贝叶斯垃圾邮件过滤器的完整源代码。训练数据(电子邮件)保存在一个 SQLite 数据库中,该数据库也包含在同一个文件夹中('test.db')。你所需的唯一外部库是 Python 绑定到 sqlite 的库(pysqlite),如果还没有安装 sqlite,你也需要安装它。
我发现Divmod Reverend是最简单、最易于使用的Python贝叶斯分类器。