我可以帮您进行翻译。以下是需要翻译的内容:
我有一个包含17,000个字符串的数组。其中许多字符串具有相似的匹配项,例如:
User Report XYZ123
Bob Smith
User Report YEI723
User Report
User Report
Number of Hits 27
Frank's Weekly Transaction Report
Transaction Report 123
什么是查找顶部“相似字符串”的最佳方法?例如,使用上面的示例,我希望看到“用户报告”和“交易报告”作为顶部“相似字符串”中的两个。
levenshtein()
函数来确定两个字符串之间的距离。 - Nadh