我最近将Levenshtein算法引入了我们的搜索引擎数据库,但是我们遇到了一个问题。
根据基本的Levenshtein规则:
Levenshtein('123456', '12x456')与Levenshtein('123456', '12345x')的值相同。
通常情况下这没问题,但对于我的特定问题来说是不正确的。当有人使用我们的网站时,这是错误的。电子元器件制造商经常只在最后一个字母上有所不同地生产类似的产品。如果第一个字母不同,通常就属于完全不同的类别。因此,我需要一种算法,将单词开头附近的匹配项视为比后面的更有价值,换句话说,发生在开头附近的不匹配应该有较大的惩罚。
如果有任何想法,请告诉我。