网页推荐系统

Question

6

我正在尝试构建一个推荐系统，根据用户的行为（谷歌搜索、点击或对网页进行评分）来向用户推荐相应的网页。要了解谷歌新闻的工作方式，它是基于某个主题展示从网络上获取到的新闻文章。技术上说这被称为聚类，但我的目标类似。它将基于用户的行为进行基于内容的推荐。

所以我的问题是：

- Rajan Soni

2

你可以写多本关于你的问题的书。 - Thomas Jungblut

哈哈，它们听起来像是大问题吗？我正在寻找一个简单的解决方案。只需要简要描述如何处理这样的项目。 - Rajan Soni

1

《集体智慧编程》（Programming Collective Intelligence）是一本简单易懂、无需数学基础的机器学习入门书籍，其中包含了与您提出问题类似的案例。 - Maurits

2个回答

4

这篇文章值得一读：Google news personalization: scalable online collaborative filtering。它主要关注的是协作过滤而非基于内容的推荐，但涉及到一些非常有趣的点，如可扩展性、物品流失、算法、系统设置和评估。

Mahout拥有非常好的协作过滤技术，即所描述的使用用户行为（点击、阅读等），并可以通过重评分器类引入一些基于内容的方法。

你还可以看看Myrrix，它在某些方面是Mahout推荐部分（也称为口味）的升级版。此外，它还允许使用重评分器类在协作过滤之上应用基于内容的逻辑。

如果你对Mahout感兴趣，最好从Mahout实战开始。

- Julian Ortega

谢谢Astatic。我还没有阅读你建议的论文，但希望它涵盖了谷歌如何从整个网络中找到网页，与从单个站点获取文章进行比较。Myrrix看起来很有趣，需要进一步了解。再次感谢。 - Rajan Soni

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- zenog · Accepted Answer

正如Thomas Jungblut所说，你的问题可以写出几本书;-) 我会尝试给您提供一个简短的指南清单 - 但请注意，没有现成的解决方案...