关于字符串算法已经有很多帖子: 查找相似文本的算法 相似字符串算法 高效字符串匹配算法 然而,没有提到任何一般性的文献。 请问有没有推荐的书籍可以全面地探讨各种字符串算法?特别感兴趣的话题是模糊字符串匹配(例如谷歌提供的更正搜索字符串变体)。 非常感谢您的建议。
我很惊讶没有人提到丹·格斯菲尔德的优秀著作《字符串、树和序列的算法》,该书覆盖了比任何人可能需要的更详细的字符串算法。几年前我在进行蛋白质测序项目时得到了很好的服务。阅读此书后,您将学习: 朴素字符串匹配 基于预处理器的算法(Boyer Moore、Knuth-Morris-Pratt) 正则表达式匹配算法 Karp-Rabin和类似方法 后缀树方法(Ukkonen的方法等) 序列对齐(Levenshtein距离和字符串相似性以及多序列对齐) 应用于DNA测序、基因预测和其他领域。
这不是一本书的推荐,而是一个提供大量高效字符串匹配算法实现的图书馆和网站: http://www.dcs.shef.ac.uk/~sam/simmetrics.html 它还为每个项目提供了进一步学习的链接,并指出最适用的领域。