目前,我已经在ElasticSearch中索引了许多文档,当我使用最大分数进行搜索时,数字超过了1。 我该如何获得相似度搜索,范围在0到1之间? 我应该更好地配置ElasticSearch?还是我应该更改我的映射? 提前感谢您的建议。
Lucene评分不是基于tif id向量的传统余弦相似度函数,而是一些修改,考虑了其他因素,如字段或查询术语上的增强。您可以在页面上阅读有关评分公式的更多详细信息。因此,获取0.0到1.0之间的得分的最简单方法就是将elasticsearch响应中的规范化分数与max_score一起使用(它与第一个文档的得分重合)。