我正在寻找一种模糊搜索的方式,其中文本数据库和查询可能具有拼写变体。特别是,文本数据库是从网络收集的材料,不太可能从全文引擎的准备阶段(单词词干)中受益。 我可以想象使用pg_trgm作为起点,然后通过Levenshtein验证命中。然而,人们倾向于进行前缀查询,例如,在音乐领域,我希望“beetho交响乐”是一个合理的搜索词。因此,如果有人键入“betho交响乐”,是否有合理的方法(使用postgresql和TCL或Perl脚本),以发现“betho”部分应与“beetho”进行比较(返回编辑距离为1)。