如何衡量两个字符串之间的相似度?

55

给定两个字符串 text1text2

public SOMEUSABLERETURNTYPE Compare(string text1, string text2)
{
     // DO SOMETHING HERE TO COMPARE
}

示例:

  1. 第一个字符串:StackOverflow

    第二个字符串:StaqOverflow

    返回:相似度为91%

    返回结果可以是%或类似的东西。

  2. 第一个字符串:The simple text test

    第二个字符串:The complex text test

    返回:这些值可以被认为是相等的

有什么想法吗?最好的方法是什么?


9
为什么您认为示例2中的两个字符串应该相等? - Sinan Ünür
我有什么遗漏吗?除了第一个例子可能暗示了音韵相似性之外,原帖作者是否表达了他关心的是音韵而不是字符?第二个例子显然没有。 - Kevin
我猜“相似度”和“音形码”是最接近的,但它们是不同的东西。“相似度”验证需要使用“音形码”算法和“相似度”算法才能正确验证文本。 - Zanoni
@kcrumley:第二个例子只是假设。对于每个找到的单词,具有一定相似性的字符串可以被视为相似。 - Zanoni
12个回答

1

1

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接