如果我只需要考虑ASCII字符,则可以在
O(n)
时间复杂度和
O(1)
空间复杂度内完成。我的代码还打印出了排列,但可以轻松修改为在第一次出现时返回true。代码的主要部分位于
printAllPermutations()
方法中。以下是我的解决方案:
一些背景知识
这是我想出来的解决方案,与Rabin Karp算法的思想有些相似。在了解算法之前,我将如下解释其数学原理:
假设S = {A_1, ..., A_n} 是一个只包含质数的大小为N的multiset列表,让S中数字的总和等于某个整数Q。然后S是唯一可能完全由质数组成的大小为N的multiset,其元素之和可以等于Q。
因此,我们知道可以将每个字符映射到质数。我提出了以下映射:
1 -> 1st prime
2 -> 2nd prime
3 -> 3rd prime
...
n -> nth prime
如果我们这样做(因为ASCII只有256个可能的字符),那么我们很容易在更大的字符串B中找到每个排列。
算法如下:
1. 计算映射到A中每个字符的质数之和,称为smallHash。
2. 创建两个索引(righti和lefti)。righti初始化为零,而lefti初始化为A的大小。
ex: | |
v v
"abcdabcd"
^ ^
| |
3:创建变量currHash,并将其初始化为B中lefti和righti之间的每个字符所映射的对应素数之和。
4:同时将righti和lefti增加1,每次通过减去不再范围内(lefti-1)的字符所对应的素数并添加刚刚添加到范围(righti)中的字符所对应的素数来更新currHash。
5:每当currHash等于smallHash时,该范围内的字符必须是一个排列。然后我们打印它们。
6:继续直到我们到达B的末尾。(当righti等于B的长度时)
此解决方案的时间复杂度为O(n)
,空间复杂度为O(1)
。
实际代码:
public class FindPermutationsInString {
static int primes[] =
{
2, 3, 5, 7, 11, 13, 17, 19, 23, 29,
31, 37, 41, 43, 47, 53, 59, 61, 67, 71,
73, 79, 83, 89, 97, 101, 103, 107, 109, 113,
127, 131, 137, 139, 149, 151, 157, 163, 167, 173,
179, 181, 191, 193, 197, 199, 211, 223, 227, 229,
233, 239, 241, 251, 257, 263, 269, 271, 277, 281,
283, 293, 307, 311, 313, 317, 331, 337, 347, 349,
353, 359, 367, 373, 379, 383, 389, 397, 401, 409,
419, 421, 431, 433, 439, 443, 449, 457, 461, 463,
467, 479, 487, 491, 499, 503, 509, 521, 523, 541,
547, 557, 563, 569, 571, 577, 587, 593, 599, 601,
607, 613, 617, 619, 631, 641, 643, 647, 653, 659,
661, 673, 677, 683, 691, 701, 709, 719, 727, 733,
739, 743, 751, 757, 761, 769, 773, 787, 797, 809,
811, 821, 823, 827, 829, 839, 853, 857, 859, 863,
877, 881, 883, 887, 907, 911, 919, 929, 937, 941,
947, 953, 967, 971, 977, 983, 991, 997, 1009, 1013,
1019, 1021, 1031, 1033, 1039, 1049, 1051, 1061, 1063, 1069,
1087, 1091, 1093, 1097, 1103, 1109, 1117, 1123, 1129, 1151,
1153, 1163, 1171, 1181, 1187, 1193, 1201, 1213, 1217, 1223,
1229, 1231, 1237, 1249, 1259, 1277, 1279, 1283, 1289, 1291,
1297, 1301, 1303, 1307, 1319, 1321, 1327, 1361, 1367, 1373,
1381, 1399, 1409, 1423, 1427, 1429, 1433, 1439, 1447, 1451,
1453, 1459, 1471, 1481, 1483, 1487, 1489, 1493, 1499, 1511,
1523, 1531, 1543, 1549, 1553, 1559, 1567, 1571, 1579, 1583,
1597, 1601, 1607, 1609, 1613, 1619
};
public static void main(String[] args) {
String big = "abcdabcd";
String small = "abcd";
printAllPermutations(big, small);
}
static void printAllPermutations(String big, String small) {
if (big.length() < small.length()) return;
int smallHash = primeHash(small, 0, small.length());
int lefti = 0, righti = small.length();
int currentHash = primeHash(small, 0, righti);
while (righti <= big.length()) {
if (currentHash == smallHash)
System.out.println(big.substring(lefti, righti));
currentHash -= primeHash(big.charAt(lefti++));
if (righti < big.length())
currentHash += primeHash(big.charAt(righti));
righti++;
}
}
static int primeHash(String str, int start, int end) {
int value = 0;
for (int i = start; i < end; i++) {
value += primeHash(str.charAt(i));
}
return value;
}
static int primeHash(Character chr) {
return primes[chr];
}
}
请注意,这种解决方案仅适用于字符只能是ASCII字符的情况。如果我们谈论Unicode,则会涉及到超过int
甚至double
最大大小的质数。此外,我不确定是否有1,114,112个已知的质数。
freqB [i]
中累加字符i在字符串B中出现的次数。(例如,在您的示例中,freqB ['d'] == freqB ['e'] == freqB ['p'] == 1
,对于所有其他字符i
,freqB [i] == 0
。)freqA []
中,然后检查是否对于每个字符i
,freqA[i] == freqB[i]
。如果是这样,则表示匹配成功。要从从位置j开始的长度为m的窗口移动到下一个窗口,您需要执行--freqA[A[j]]
和++freqA[A[j+m]]
。