我正打算将基于Sphinx的搜索集成到网站中,但我发现它没有拼写纠正的内置支持。网络上的人们建议使用pspell或其他第三方库来完成这项工作,但问题是我要搜索的数据主要包含像品牌名称这样的“技术”术语,因此我不认为常用库会包含它们。
另一方面,Xapian声称具有基于索引数据的拼写纠正支持,正好符合我的需求。值得使用Xapian吗?我仍然很困惑应该使用哪个全文搜索引擎:Sphinx似乎很不错,但缺少Xapian(或者Lucene?)的一些酷炫功能,而后者看起来社区较小,文档也较少。
我认为我可以使用自定义字典来解决pspell字典中不存在的单词的问题,但我不确定是否会带来明显的性能损失?我将在一个相当流行的网站上使用搜索系统进行聚光灯搜索(通过ajax在输入每个字母时进行单独的搜索),因此性能很重要。
理想情况下,我希望使像品牌名称这样的字段比普通字典更具优先级,但我想那并不重要,因为大多数品牌名称与其他单词非常不同。
欢迎就自定义全文搜索引擎的一般设计提出任何建议。
谢谢
另一方面,Xapian声称具有基于索引数据的拼写纠正支持,正好符合我的需求。值得使用Xapian吗?我仍然很困惑应该使用哪个全文搜索引擎:Sphinx似乎很不错,但缺少Xapian(或者Lucene?)的一些酷炫功能,而后者看起来社区较小,文档也较少。
我认为我可以使用自定义字典来解决pspell字典中不存在的单词的问题,但我不确定是否会带来明显的性能损失?我将在一个相当流行的网站上使用搜索系统进行聚光灯搜索(通过ajax在输入每个字母时进行单独的搜索),因此性能很重要。
理想情况下,我希望使像品牌名称这样的字段比普通字典更具优先级,但我想那并不重要,因为大多数品牌名称与其他单词非常不同。
欢迎就自定义全文搜索引擎的一般设计提出任何建议。
谢谢