7得票1回答
Solr的MoreLikeThis组件是如何内部工作以获得结果的?

我是Apache Solr的新手,目前正在探索/尝试使用MoreLikeThis作为搜索组件(而不是专用请求处理程序)。 我发现很难清楚地理解它内部如何工作以获取类似于此的结果? 例如,我正在尝试在名为mytextcontentfield的文档字段中搜索单词java: http://lo...

7得票2回答
Elasticsearch 更像这个查询

我正在努力理解更多类似内容查询的工作原理,但好像有些东西我没弄明白。我已经阅读了文档,但ES文档通常有点缺失。 目标是能够通过词频限制结果,就像这里尝试的那样。 因此,我建立了一个简单的索引,包括术语向量进行调试,然后添加了两个简单的文档。 DELETE /test_index PUT...

7得票2回答
Solr 的 MoreLikeThis 提高查询字段

我正在尝试使用Solr的MoreLikeThis功能。 我的架构涉及文章,并且我正在寻找三个字段内的文章之间的相似之处: article_title、article_text和topic。 以下查询效果很好: q=id:(2e2ec74c-7c26-49c9-b359-31a11ea50...

7得票2回答
Zend Lucene MoreLikeThis

我正在使用Zend_Search_Lucene来作为我的搜索引擎。遗憾的是,它缺少一个MorelikeThis方法的实现,该方法可以在索引中查找相似的文档。 有没有人发现过一个不错的Zend端口实现这个功能? 我发现了一个Drupal模块,但不知道是否可以在没有严重修改的情况下与Zend一...

7得票3回答
测量文档集之间的相似度

为了说明,我们假设这是一个论坛服务。我需要计算每个用户帖子之间的“相似性”,以便结果类似于: among posts by user A, similarity 60% among posts by user B, similarity 20% ... 我正在处理多字节字符串,所以我想我...

7得票1回答
Elasticsearch:如何存储术语向量

我正在从事一个项目,其中我大量使用Elasticsearch,并利用moreLikeThis查询来实现一些功能。 MLT查询的官方文档如下所述: 为了加快分析速度,将术语向量存储在索引时间可能有所帮助,但会增加磁盘使用。 在“工作原理”部分中,现在的想法是调整映射以存储预先计算的术语向...