推荐系统 - 召回率@K和精确度@K

3

我正在为公司建立一个推荐系统，有一个关于计算精度@K和召回率@K的公式的问题，在谷歌上找不到相关信息。

对于精度@K，一般公式是在前k个推荐项中，有多少比例是相关的。

我的问题是如何定义哪些项目是相关的，哪些不相关，因为用户不一定与所有可用项目进行交互，而只是其中的一小部分。如果在前k个推荐项中缺乏基础真实数据，那么我们应该忽略它们还是认为它们是不相关的项目？

下面的文章建议忽略这些未交互的项目，但我对此并不确定。

提前非常感谢。

- Quan Nguyen

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- scign · Accepted Answer

您提到了“推荐项目”，因此我假设您正在谈论计算推荐引擎的精度，即前 k 个预测中准确预测用户未来互动的数量。

推荐引擎的目标是从过去的互动中建模未来的互动。这样的模型是在交互数据集上训练的，最后一个互动是目标，而过去的 n 个互动是特征。

因此，精度可以通过在已知地面真实情况（即最后一次互动）的测试集上运行模型，并将地面真实情况在前 k 个预测中的数量除以总测试项目数来计算。

未与用户互动的项目不会出现，因为我们正在训练其他用户的行为模型。