有类似的问题,但与我可以在源代码中使用的C#库无关。
感谢大家的帮助。
我已经看过Lucene,但我需要一些更容易搜索相似字符串且没有索引部分的开销。
我标记的答案有两个非常简单的算法,其中一个还使用了LINQ,所以非常完美。
有类似的问题,但与我可以在源代码中使用的C#库无关。
感谢大家的帮助。
我已经看过Lucene,但我需要一些更容易搜索相似字符串且没有索引部分的开销。
我标记的答案有两个非常简单的算法,其中一个还使用了LINQ,所以非常完美。
你还可以查看非常出色的库,名为Sam's String Metrics https://github.com/StefH/SimMetrics.Net,其中包含许多算法。
这些不是我自己的创造,但它们是我最喜欢的函数之一。我在博客文章中介绍了它们,并发布了我自己调整的版本,其中包括Dice系数、Levenshtein距离、最长公共子序列和Double Metaphone,该博客文章名为“Four Functions for Finding Fuzzy String Matches in C# Extensions”。
我使用了“C#三叉搜索树字典”(http://www.codeproject.com/KB/recipes/tst.aspx)来搜索相似的字符串。
敬礼,Patricio