我们有一个拥有86315770个文档的Solr实例。它占用了4GB的内存,并且我们需要对经过分词的内容字段进行faceting操作。磁盘上的索引大小为23GB。
为什么我们要在分词后的字段上进行faceting?因为我们想查询该字段上使用最多的前n个术语。问题是这样的查询太耗时间了。是否有办法改善进行此类faceting时的时间?有什么建议吗?
提前感谢您的帮助。
为什么我们要在分词后的字段上进行faceting?因为我们想查询该字段上使用最多的前n个术语。问题是这样的查询太耗时间了。是否有办法改善进行此类faceting时的时间?有什么建议吗?
提前感谢您的帮助。
facet.limit
吗?我注意到即使有10万条以上的记录,如果没有设置facet.limit
(在您的情况下,无论n
是多少),这种查询可能需要很长时间。 - David Faber