11pt平均精度指标是什么?

5

我有两个问题

1- 什么是“11pt平均精度指标”?

2- 如何在信息检索中使用它?

谢谢

2个回答

24

这主要来自Christopher D. Manning、Prabhakar Raghavan和Hinrich Schütze的书 "Introduction to Information Retrieval"

在排名检索中,您有精确度和召回率。 精确度是系统返回文档的准确性(1.0表示它只返回相关文档)。 召回率是系统找到的相关文档的百分比(1.0表示它找到了所有相关文档)。 因此,您可以通过返回越来越多的文档来调整系统的召回率,但是这会与精确度产生权衡,因为您可能会容纳更多错误。

插值精度是您选择一个召回级别r,并且对于所有召回级别P(r')> = P(r),其中P(r)是排名r处的精度。 这是您可以实现的最佳精度。

然后,在11点插值平均精度中,您正在查看11个召回级别(0.0、0.1、0.2、...、1.0),并找到每个点的插值精度。 您将这些得分平均化,跨所有不同的查询或信息需求(如Manning&Schuetze书所述)找到您的系统得分。

在信息检索中,Typical usage主要用于评估。它可以帮助您比较一个系统与另一个系统的差异,但真正有用的是当您调整参数时,它可以让您比较您的系统如何变化。更改此设置是否会提高或损害我的11个点的interp avg prec?好处是,它测量了您收集中所有信息需求,因此有助于给您提供“大局”视图。但是,请注意不要过度依赖这些指标,因为它们只能像您使用的评估集一样好。


1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接