我正在寻找一种高效的解决方案,以在主字符串中容忍n个不匹配项的情况下找到可能最长的子字符串。
例如: 主字符串
1. AGACGTAC TACTCTACT AGATGCA*TACTCTAC* 2. AGACGTAC TACTCTACT AGATGCA*TACTCTAC* 3. AGACGTAC TACTCTACA AGATGCA*TACTCTAC* 4. AGACGTAC TACTTTACA AGATGCA*TACTCTAC*
搜索字符串: TACTCTACT:应被视为与上述所有主字符串匹配。
另外,有可能出现子字符串的一部分位于主字符串的末尾,我也想将其包括在内。
如果您能提供一些指导意见,我将不胜感激。
注:我将有一个搜索字符串和大约1亿个主字符串来搜索子字符串。
谢谢! - Abhi
例如: 主字符串
1. AGACGTAC TACTCTACT AGATGCA*TACTCTAC* 2. AGACGTAC TACTCTACT AGATGCA*TACTCTAC* 3. AGACGTAC TACTCTACA AGATGCA*TACTCTAC* 4. AGACGTAC TACTTTACA AGATGCA*TACTCTAC*
搜索字符串: TACTCTACT:应被视为与上述所有主字符串匹配。
另外,有可能出现子字符串的一部分位于主字符串的末尾,我也想将其包括在内。
如果您能提供一些指导意见,我将不胜感激。
注:我将有一个搜索字符串和大约1亿个主字符串来搜索子字符串。
谢谢! - Abhi