推荐算法

5

我需要为一个网站制作推荐算法。我已经想出了一种非常简单的方法来实现这个目标,但是想知道是否有任何文献或类似的资源可以帮助我更好地了解其他示例是如何组合起来的。

我已经了解了 Apache Mahout 中的协同过滤、聚类和分类等功能,但不太清楚机器学习如何融入其中。我能够理解如何为上述内容制定算法(除了机器学习),但我想知道是否有其他可以加入到混合中的东西。

此外,你认为推荐算法的目的是什么?它最好如何运作?是否有人愿意分享定义?

谢谢!


你可能想搜索“kth最近邻算法”。 - David W
看起来有很多关于这个的内容,我会去看看,谢谢! - user1360809
你想告诉我们更多关于你正在解决的问题吗?我认为根据你拥有的数据类型,可以添加很多内容。一般来说,当你想基于他人的行为进行建议时,协同过滤非常好用。然后还有基于内容的过滤。你可以将两者制作成混合算法。http://en.wikipedia.org/wiki/Recommender_system#Hybrid_Recommender_Systems - zubinmehta
这里有一本2011年出版的全面介绍该主题的书籍,你可能可以通过图书馆或其他途径获得访问权。 - Danica
3个回答

5
这里有一篇文章,讨论了不同算法的组合和创建推荐系统的不同可能性。作者分析了37个不同系统及其参考文献,并将它们归类为8个基本维度的列表。
尽管该论文发表于2003年,其中一些示例现在不再可用,但仍可作为研究人员构建自己的推荐系统的很好起点。
我想分享Robin Burk在他的论文中对推荐系统的定义:
任何产生个性化推荐输出或以个性化方式引导用户在大量可能选项中找到有趣或有用对象的系统。

1
该链接文章为:Montaner M.,López,B.,de la Rosa,J.Ll.互联网推荐代理分类法。人工智能评论19:285-330,2003年6月。由于撰写此评论时链接已失效,但该文章可在https://github.com/gpfvic/IRR/blob/master/A%20Taxonomy%20of%20Recommender%20Agents%20on%20the%20Internet.pdf上获得。 - Attila

4
推荐系统是人工智能(尤其是数据挖掘)中的一个话题,旨在向用户推荐新的物品。这些物品可以是任何类型,例如图书、旅行、音乐等。
它主要由算法组成,该算法将尝试从先前的数据(如用户偏好)中提取一些知识以建议新的可购买物品。
Netflix和Amazon广泛使用此技术。当您看到短语“购买此商品的用户也喜欢那件商品”时,很可能背后有一个推荐系统。
聚类和其他类似的算法是用于改进推荐系统的方法之一。例如,您可能希望在应用特定的推荐系统之前按相似性对用户进行分组,以获得更好的结果。为此,您可以使用K最近邻算法。
这两篇文章可能会帮助您更好地理解这个主题: Greg Linden、Brent Smith和Jeremy York的“Amazon.com推荐:物品对物品协同过滤”; Robin Burke的“混合推荐系统:调查和实验。用户建模和用户自适应交互”。

3

现在有一门由明尼苏达大学的Joeseph Konstan教授讲授的优秀的Coursera推荐系统课程。他是该领域的先驱之一。这门课程是免费的,内容涵盖了推荐系统的基本分类,包括:

 - Rating Systems
 - Content Based Filters
 - Collaborative Systems (User-user and Item-item)
 - Dimensionality Reduction (SVD, its meaning, and how to compute it)
 - Hybrid Systems

SVD是机器学习领域的一个重要部分,我认为这个课程对SVD进行的解释非常有条理和直观——在我看过的相关资料中,这个课程是最好的。

此外,它还展示了如何使用Lenskit(一款学术推荐系统工具包)创建实际应用系统。显然,我很喜欢这门课程,但我希望他们也能介绍贝叶斯方法。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接