我有两个问题
1- 什么是“11pt平均精度指标”?
2- 如何在信息检索中使用它?
谢谢
我有两个问题
1- 什么是“11pt平均精度指标”?
2- 如何在信息检索中使用它?
谢谢
这主要来自Christopher D. Manning、Prabhakar Raghavan和Hinrich Schütze的书 "Introduction to Information Retrieval"
在排名检索中,您有精确度和召回率。 精确度是系统返回文档的准确性(1.0表示它只返回相关文档)。 召回率是系统找到的相关文档的百分比(1.0表示它找到了所有相关文档)。 因此,您可以通过返回越来越多的文档来调整系统的召回率,但是这会与精确度产生权衡,因为您可能会容纳更多错误。
插值精度是您选择一个召回级别r,并且对于所有召回级别P(r')> = P(r),其中P(r)是排名r处的精度。 这是您可以实现的最佳精度。
然后,在11点插值平均精度中,您正在查看11个召回级别(0.0、0.1、0.2、...、1.0),并找到每个点的插值精度。 您将这些得分平均化,跨所有不同的查询或信息需求(如Manning&Schuetze书所述)找到您的系统得分。
在信息检索中,Typical usage主要用于评估。它可以帮助您比较一个系统与另一个系统的差异,但真正有用的是当您调整参数时,它可以让您比较您的系统如何变化。更改此设置是否会提高或损害我的11个点的interp avg prec?好处是,它测量了您收集中所有信息需求,因此有助于给您提供“大局”视图。但是,请注意不要过度依赖这些指标,因为它们只能像您使用的评估集一样好。