我需要尽可能快地在一个非常大的字符串中查找一组子字符串(每个约32个字符)。 我需要进行模糊搜索。
什么是最好的算法? 我尝试了扫描整个大字符串以查找小字符串,并在每个步骤中检查Levenshtein距离,但这需要很长时间。
我需要尽可能快地在一个非常大的字符串中查找一组子字符串(每个约32个字符)。 我需要进行模糊搜索。
什么是最好的算法? 我尝试了扫描整个大字符串以查找小字符串,并在每个步骤中检查Levenshtein距离,但这需要很长时间。
找到每个字母的第一次出现。
对于字符串中的每个位置,在该位置之后找到每个字母的下一个出现位置(可以通过从末尾扫描每个字母来以O(l * n)的时间复杂度完成,其中l是字符串的长度,n是字母表的大小)
对于你的一组字符串中的每个字符串,找到该字符串的第一个字母的第一次出现,然后从该位置开始查找你的字符串中第二个字母的第一次出现等。