编辑距离 - 带记忆化

5

我正在尝试解决编辑距离问题,并缓存结果,以避免重复调用。在尝试将子问题存储在映射中之前,它是可以正常工作的,但现在它停止了。对于我所做的这个调用,比较 "thou shalt not" 和"you should not",它返回1。显然是错误的,但为什么呢?

using namespace std;
int counter = 0;

int match(char c1, char c2){
  c1 == c2 ? 0 : 1;
}

int edit_distance(string s1, string s2,map<pair<string,string>, int>& memo){
  if(memo[make_pair(s1,s2)])
    return memo[make_pair(s1,s2)];
  int i = s1.size();
  int j = s2.size();

  if(s1.empty())
    return memo[make_pair(s1,s2)] = 1 + j;
  if(s2.empty())
    return memo[make_pair(s1,s2)] = 1 + i;

  int opt[3];

  opt[0] = edit_distance(s1.substr(1), s2.substr(1),memo) + match(s1[i-1],s2[j-1]);
  opt[1] = edit_distance(s1.substr(1), s2,memo) + 1;
  opt[2] = edit_distance(s1, s2.substr(1),memo) + 1;

  int min = opt[0];
  for(int i = 1; i < 3; i++){
    if(opt[i] < min)
      min = opt[i];
  }
  memo[ make_pair(s1,s2) ] = min;
  return min;
}

int edit_distance_driver(string s1, string s2){
  map<pair<string,string>,int> memo;
  return edit_distance(s1, s2, memo);
}

int main(){
  cout << edit_distance_driver("thou shalt not","you should not") << endl;
}

1
你的匹配函数中的返回语句在哪里?难道不应该是 return c1 == c2 ? 0 : 1; 吗? - Abhishek Bansal
2个回答

4
问题在这里:
opt[0] = edit_distance(s1.substr(1), s2.substr(1),memo) + match(s1[i-1],s2[j-1]);

您要排除第一个字符,然后进行递归,但是检查的是最后字符。

相反,您应该检查前面的字符,因此应该是:

opt[0] = edit_distance(s1.substr(1), s2.substr(1),memo) + match(s1[0],s2[0]);

显然,match应该返回一些内容:
int match(char c1, char c2){
  return c1 == c2 ? 0 : 1;
}

然后你的代码会输出那些字符串的6


0
否则,我认为您在提取前缀时遇到了问题,您应该使用:s1.substr(0,s1.size()-1)来消除字符串中的最后一个字符。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接