我强烈推荐Weka,它是一款用Java编写的开源数据挖掘软件: Weka是一个用于数据挖掘任务的机器学习算法集合。这些算法可以直接应用于数据集,也可以从自己的Java代码中调用。Weka包含了数据预处理、分类、回归、聚类、关联规则和可视化工具。它也非常适合开发新的机器学习方案。 正如上面提到的,它附带了许多不同的分类器,比如SVM,Winnow,C4.5,朴素贝叶斯(当然还有其他更多的,详见API文档)。请注意,在垃圾邮件检测或文本分类领域,许多分类器已经被证明比朴素贝叶斯具有更好的性能。 此外,Weka还带来了一个非常强大的GUI...