如何获取或生成推荐系统的测试数据

10

我目前正在研究推荐系统,想知道其他研究人员如何获取或生成测试数据以评估系统的性能?

2个回答

8

7
我不知道你正在评估哪个领域,但如果是电影推荐,你可以使用MovieLens数据来开始。这些数据来自GroupLens。(他们的网站似乎暂时关闭了,但我相信它很快就会恢复。)
他们有三组数据-100,000个投票(偏好),1百万和1千万-看起来他们或多或少是每个人都开始使用的标准。

太棒了!感谢提供这些信息。如果有人正在寻找基于项目而非评分的数据集怎么办?例如,协同过滤与内容过滤/项目过滤/信息检索。 - Ullr
你是什么意思?Grouplens集合也可以用于协同过滤。 - Eyal

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接