有没有人知道是否存在一种算法,可以给定一个字符串A和一个字符串数组B,将A字符串与B中的所有字符串进行比较,输出最相似的结果。
对于“最相似的结果”,我的意思是例如:
如果A字符串是:“hello world how are you”
那么
“asdf asdewr hello world how asfrqr you”
比
“h2ll4 w1111 h11 111 111”
更相似。
有没有人知道是否存在一种算法,可以给定一个字符串A和一个字符串数组B,将A字符串与B中的所有字符串进行比较,输出最相似的结果。
对于“最相似的结果”,我的意思是例如:
如果A字符串是:“hello world how are you”
那么
“asdf asdewr hello world how asfrqr you”
比
“h2ll4 w1111 h11 111 111”
更相似。
通常使用的度量标准是Levenshtein距离。计算原始内容与每个候选内容之间的Levenshtein距离,并将最小距离作为最可能的候选内容。
定义相似性。能够完成此操作的算法包括:
所有这些算法都可以在C或C++中实现。搜索“字符串相似性”、“重复查找”或“记录链接”以获取可用的度量和算法。