有没有针对中等规模文本数据(数百GB)的快速搜索解决方案?无论是商业软件还是开源软件都可以。需要指出的是,我需要它基于C++或C。
Apache Lucene是一个常用的索引引擎,不确定它是否能够称为万无一失的解决方案。我曾见过这个引擎与Carrot2结合使用,以进行索引的聚类和搜索。
还有xapian。
Solr也是一个选择。这也是基于Lucene的引擎。
http://lucene.apache.org/solr/