如何评估基于内容的推荐系统

19

我正在构建一个基于内容的电影推荐系统。它很简单,只需让用户输入电影标题,系统将找到具有最相似特征的电影。

在计算相似度并按降序对分数进行排序后,我找到了5个最高相似度分数的相应电影并返回给用户。

一切都运作良好,直到我想要评估该系统的准确性为止。我在Google上找到的一些公式仅基于评分值来评估准确性(比较预测评分和实际评分,如RMSE)。我没有将相似度分数转换为评分(从1到5的范围),因此无法应用任何公式。

您能否建议一种将相似度分数转换为预测评分的方法,以便我可以应用RMSE?或者是否有任何解决此问题的想法?


3
这个问题更适合在Cross Validated上提问吧? - jeff
1个回答

18

你有任何真实数据吗?例如,你是否拥有有关用户过去所喜欢/观看/购买的电影信息?它不必是评级,但为了评估推荐,您需要了解一些关于用户偏好的信息。

如果有,那么除了RMSE之外还有其他方法来衡量准确性。 RMSE用于预测评级(如您所说,是真实评分和预测之间的误差),但在您的情况下,您正在生成前N个推荐。在这种情况下,您可以使用精确度和召回率来评估您的推荐。它们在信息检索应用中非常常见(请参见维基百科),并且在推荐系统中也非常常见。您还可以计算F1指标,它是精确度和召回率的调和平均数。您会发现它们是非常简单的公式,易于实现。

《推荐系统评估》由Guy Shani撰写的一篇论文,介绍了如何评估推荐系统,并将为您提供对所有内容的深入了解。您可以在这里找到该论文。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接