我希望能够在Lucene查询中找到术语的计数。例如,我有两个字段,一个是位置,另一个是类别。如果我运行一个查询以获取“洛杉矶,加利福尼亚州”中的所有文档,然后我想要能够快速查看这些文档的类别是什么。我知道Solr可以使用faceting来完成这种事情,但我希望能够使用普通的Lucene来完成。目前,我正在循环遍历所有文档ID,然后使用哈希表来计算术语的数量,但速度非常慢。
一种获取termenum但限制为我的查询的方法将是理想的。
一种获取termenum但限制为我的查询的方法将是理想的。
目前我正在为我们使用的框架开发类似的东西。
我收集了一些描述问题和解决方案的资源,链接如下: http://code.google.com/p/gtxcontentconnector/issues/detail?id=41