在大量未缩写的字符串列表中快速匹配缩写词的字符串搜索算法?

3
我很难找到一个符合我的要求的字符串匹配算法。
我有一个非常大的字符串数据库,需要将其与任意缩写匹配。实际子字符串中没有字母的字符串也应该匹配,并且得分更高。
例如:如果要匹配的单词是“download”,我搜索“down”、“ownl”和“dl”,则“down”的匹配得分最高,其次是“ownl”,然后是“dl”。
该算法必须针对速度和大量字符串进行优化,并允许我返回匹配项列表(如果我已将“download”和“upload”添加到数据库,则搜索“load”应同时返回两者)。内存仍然很重要,但速度比内存更重要。
有什么想法吗?我已经研究了一些这些算法,但我没有找到任何涉及缩写的算法,更不用说满足所有这些条件的算法了!
1个回答

0

我在想是否可以将Peter Norvig的拼写检查器以某种方式适应于这个问题。

虽然我还没有着手解决这个难题,但是这个优雅的解决方案确实值得我们去了解。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接