我刚刚读到团队BellKor's Pragmatic Chaos正在Wired上赢得Netflix挑战,我很好奇这种算法通常是如何工作的。我知道Bellkor团队的解决方案在该领域必定是创新的...但该领域通常是如何工作的呢?它只是一个非常详细的数据库,反复运行马尔科夫链,还是其他什么?
我刚刚读到团队BellKor's Pragmatic Chaos正在Wired上赢得Netflix挑战,我很好奇这种算法通常是如何工作的。我知道Bellkor团队的解决方案在该领域必定是创新的...但该领域通常是如何工作的呢?它只是一个非常详细的数据库,反复运行马尔科夫链,还是其他什么?
请看这个维基百科条目: 欧几里得距离.
基本思想是使用距离度量(比如上面的欧几里得距离)来比较人或物之间的相似性。
O'Reilly新书,编程集体智能:构建智能Web 2.0 应用程序中有一章非常详细地讲解了这个主题。
但这个领域通常是如何工作的呢?
这是一种数据挖掘技术。数据挖掘是商业智能(数据仓库等)的一部分,试图在海量数据中找到关系和信息。它是计算机科学的一个领域,也涉及到机器学习,例如模式识别。关联挖掘可以获得自动推荐。高支持度的关联被显示为推荐。k最近邻算法只是机器学习/数据挖掘人员使用的众多算法之一。
如果您对基本理论感兴趣,我建议阅读Ian H. Witten的《数据挖掘:实用机器学习工具和技术》。