我有个印象,Levenshtein算法对于这样的任务来说速度太慢了。为了检查其行为,我首先在Java中实现它,在方法的每个递归调用中打印出两个
String
。public class Levenshtein {
public static void main(String[] arg){
String a = "Hallo Zusammen";
String b = "jfdss Zusammen";
int res = levenshtein(a, b);
System.out.println(res);
}
public static int levenshtein(String s, String t){
int len_s = s.length();
int len_t = t.length();
int cost = 0;
System.out.println("s: " + s + ", t: " + t);
if(len_s>0 && len_t>0){
if(s.charAt(0) != t.charAt(0)) cost = 1;
}
if(len_s == 0){
return len_t;
}else{
if(len_t == 0){
return len_s;
}else{
String news = s.substring(0, s.length()-1);
String newt = t.substring(0, t.length()-1);
return min(levenshtein(news, t) + 1,
levenshtein(s, newt) + 1,
levenshtein(news, newt) + cost);
}
}
}
public static int min(int a, int b, int c) {
return Math.min(Math.min(a, b), c);
}
}
然而,这里有几点需要注意:
- 我添加了检查
if(len_s>0 && len_t>0)
,因为在上述测试值下我遇到了StringIndexOutOfBoundsException
异常。 - 在上述测试值下,该算法似乎会无限计算。
是否有优化方法可以使该算法适用于我,或者我应该使用完全不同的算法来完成所需的任务?