我正在尝试使用Solr的MoreLikeThis功能。
我的架构涉及文章,并且我正在寻找三个字段内的文章之间的相似之处: article_title、article_text和topic。
以下查询效果很好:
q=id:(2e2ec74c-7c26-49c9-b359-31a11ea50453)
&rows=100000000&mlt=true
&mlt.fl=articletext,articletitle,topic&mlt.boost=true&mlt.mindf=1&mlt.mintf=1
但是我想尝试提高不同查询字段的权重,例如在文章标题上增加相似性的权重。
文档(http://wiki.apache.org/solr/MoreLikeThis)建议可以通过包含mlt.qf属性并进行一些提升来实现这一点。
我这方面的尝试查询如下:
q=id:(2e2ec74c-7c26-49c9-b359-31a11ea50453)&rows=100000000&mlt=true
&mlt.fl=articletext,articletitle,topic&mlt.boost=true
&mlt.mindf=1&mlt.mintf=1
&mlt.qf=articletext^0.1 articletitle^100 topic^0.1
然而,这些提升似乎没有任何影响 - 无论我提供什么提升,推荐结果都保持不变(我原本以为上述查询会严重偏向于标题的相似性,但事实并非如此)。我在文档中找不到使用MoreLikeThis这种方式的示例,这让我认为我做错了什么。有人成功地实现了类似的功能吗?