如何计算两个文本/字符串之间的相似度或差异百分比?

3

进一步解释

假设我有两个字符串如下:

我是一个可以飞的超级男孩!真的。

我是一个可以打破墙壁的超级男孩!真的。

因此,一些字符是相似的我是一个可以真的。。 是否有任何现成的工具可以找到这两个字符串之间的相似度/差异百分比。


这取决于你如何定义相似性... - Artefacto
我非常好奇想看看你的实现。 - Gertjan
1
@Gertjan 抱歉,回复晚了。PHP内置了这些比较函数。Levenshtein算法非常棒,链接在这里http://php.net/manual/en/function.levenshtein.php,第二个函数可以返回相似度百分比,链接在这里http://www.php.net/manual/en/function.similar-text.php。*我爱PHP* :P - Arshdeep
2个回答

5

0

这个类似问题的Stack Overflow答案提供了Levenshtein、Jaro Winkler和Smith Waterman Gotoh算法的PHP代码。

我发现Levenshtein和Jaro Winkler通常适用于较小字符串之间的拼写错误,而Smith Waterman Gotoh擅长比较句子,例如你问题中的示例。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接