分类算法初学者资源/介绍

16

大家好。我完全是初学者,对分类算法一无所知,并需要一些关于从哪里开始进行“认真阅读”的好指示。目前我正在了解,机器学习和自动分类算法是否能够成为我某个应用程序中值得添加的东西。

我已经浏览了Z. Michalewicz和D. Fogel的“如何解决问题:现代启发式方法”(特别是有关使用神经网络的线性分类器的章节),在实践方面,我正在查找WEKA工具包源代码。我的下一个(计划中)步骤将是深入研究贝叶斯分类算法的领域。

不幸的是,我在这个领域缺乏严谨的理论基础(更不用说以任何方式使用它),因此任何提示都将不胜感激;特别是,介绍可用分类算法的良好介绍将是有帮助的。作为一名工匠而非理论家,越实践越好...

有什么提示吗?

3个回答

9

我一直觉得安德鲁·摩尔的教程非常有用。它们基于坚实的统计理论,如果您选择在将来阅读论文,这些教程将非常有用。以下是简短的描述:

这些算法包括分类算法,例如决策树、神经网络、贝叶斯分类器、支持向量机和基于案例的(也称为非参数)学习。它们包括回归算法,例如多元多项式回归、MARS、局部加权回归、GMDH和神经网络。它们还包括其他数据挖掘操作,例如聚类(混合模型、k-means和分层)、贝叶斯网络和强化学习。


谢谢。这正是我在寻找的内容。 - Dirk

6

4

机器学习概述

如果想要了解这个领域的整体情况,可以观看 Andrew Ng 的机器学习课程 的视频讲座。

这门由 Andrew Ng 教授授课的 CS229 课程提供了机器学习和统计模式识别的广泛介绍。主题包括:监督学习、无监督学习、学习理论、强化学习和自适应控制。还讨论了机器学习的最新应用,如机器人控制、数据挖掘、自主导航、生物信息学、语音识别以及文本和网络数据处理等。

分类器

至于你应该使用哪种分类器,我建议先从支持向量机(SVM)开始,用于一般的应用分类任务。它们将为您提供最先进的性能,而您并不需要了解所有背后的理论,只需使用类似 WEKA 这样的软件包提供的实现即可。

如果您有一个更大的数据集,您可能想尝试使用随机森林。WEKA中也有该算法的实现,并且它们在处理大型数据时训练速度要快得多。虽然它们比SVMs使用得少,但它们的准确性往往能够与SVMs相匹配或接近。

谢谢。类似我这样的初学者,关于SVN非常易懂的介绍似乎在http://www.tristanfletcher.co.uk/SVM%20Explained.pdf。 - Dirk

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接