提高Solr查询中的协调因子

Question

提高Solr查询中的协调因子

3

我在默认Solr评分算法中遇到了问题，这与我的收集领域有关。在我的领域中，包含所有查询词或大多数查询词的文档比仅包含少量词语的文档更相关。我希望提高文档的得分，使匹配的词越多，得分越高。我知道solr已经通过乘以协调因子来提高此类文档的权重。然而，协调因子对我来说不够显著，我希望将其提高到一定的程度。我还熟悉ExtendedDismax解析器的Minimum-Should-Match功能，但该功能无法解决我的问题，因为我不想消除未匹配足够词语的文档，我只想“惩罚”它们。

是否有一种方法可以增加协调因子的重要性？如果能解决问题，我也会接受其他不使用协调因子的解决方案。

- snakile

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- femtoRgon · Accepted Answer

最简单的方法可能是编写自己的相似度计算函数。您可以使用任何您喜欢的坐标方法覆盖它，而且实现起来非常简单。例如：

public class MySimilarity extends DefaultSimilarity {
    @Override
    public float coord(int overlap, int maxOverlap) {
        return super.coord(overlap, maxOverlap)^2;
    }
}

你可以在模式中导入自己的相似性实现：

<similarity class="this.is.MySimilarity"/>