1 1 4 3 5 6 7和i = 3(值为3),在i左边的较小值的数量是1(没有重复键),在右边,较大值的数量为3。
这个问题的暴力解决方案是~N^2,通过一些额外的空间,我可以处理从较大值计算出较小值,从而将复杂度降低到~(N^2)/2。 我的问题是:有没有更快的方法来完成它?也许是NlgN?我想象中有一个数据结构可以让我更快地进行计算。
编辑:感谢大家的回复和讨论。您可以在下面找到两个好的解决方案。总是很高兴从stackoverflow的开发人员中学习。
这里提供了一个时间复杂度为 O(n log n)
的解决方案。
正如 @SayonjiNakate 所提示的那样,使用线段树(我在我的实现中使用了 Fenwick 树)的解决方案的时间复杂度为 O(n log M)
,其中 M
是数组中可能的最大值。
首先,请注意,“左侧较小元素数目”这个问题可以通过对数组进行反转和否定来等效于“右侧较大元素数目”的问题。 因此,在下面的解释中,我只描述了“左侧较小元素数目”,我称之为“lesser_left_count”。
算法 lesser_left_count:
思路是能够找到小于特定数字的总数。
定义一个大小为MAX_VALUE
的数组tree
,用于存储已出现过的数字值为1
,否则为0
。
遍历数组时,当我们看到一个数字num
,只需将值1
赋给tree[num]
(更新操作)。此时,数字num
左侧小于它的数的数量为目前为止从1
到num-1
的和(求和操作),因为所有比当前位置左侧更小的数字都已被设置为1
。
简单吧?如果我们使用Fenwick tree,则更新和求和操作可以在O(log M)
时间内完成,其中M
是数组中可能的最大值。由于我们正在迭代整个数组,因此总时间复杂度为O(n log M)
。
M
变大(我在代码中设置了M=2^20-1
,大约需要4MB的内存),它使用了很多内存。可以通过将数组中的不同整数映射到较小的整数(以保留顺序的方式)来改进此问题。通过对数组进行排序,可以简单地在O(n log n)
时间内完成映射。因此,数字M
可以重新解释为“数组中不同元素的数量”。O(n)
的时间复杂度已经太高无法在正常机器上计算。MAX_VALUE = 2**20-1
f_arr = [0]*MAX_VALUE
def reset():
global f_arr, MAX_VALUE
f_arr[:] = [0]*MAX_VALUE
def update(idx,val):
global f_arr
while idx<MAX_VALUE:
f_arr[idx]+=val
idx += (idx & -idx)
def cnt_sum(idx):
global f_arr
result = 0
while idx > 0:
result += f_arr[idx]
idx -= (idx & -idx)
return result
def count_left_less(arr):
reset()
result = [0]*len(arr)
for idx,num in enumerate(arr):
cnt_prev = cnt_sum(num-1)
if cnt_sum(num) == cnt_prev: # If we haven't seen num before
update(num,1)
result[idx] = cnt_prev
return result
def count_left_right(arr):
arr = [x for x in arr]
min_num = min(arr)
if min_num<=0: # Got nonpositive numbers!
arr = [min_num+1+x for x in arr] # Convert to minimum 1
left = count_left_less(arr)
arr.reverse() # Reverse for greater_right_count
max_num = max(arr)
arr = [max_num+1-x for x in arr] # Negate the entries, keep minimum 1
right = count_left_less(arr)
right.reverse() # Reverse the result, to align with original array
return (left, right)
def main():
arr = [1,1,3,2,4,5,6]
(left, right) = count_left_right(arr)
print 'Array: ' + str(arr)
print 'Lesser left count: ' + str(left)
print 'Greater right cnt: ' + str(right)
if __name__=='__main__':
main()
将产生:
原始数组:[1, 1, 3, 2, 4, 5, 6] 较小的左计数:[0, 0, 1, 1, 3, 4, 5] 较大的右计数:[5, 5, 3, 3, 2, 1, 0]
或者如果您想要Java代码:
import java.util.Arrays;
class Main{
static int MAX_VALUE = 1048575;
static int[] fArr = new int[MAX_VALUE];
public static void main(String[] args){
int[] arr = new int[]{1,1,3,2,4,5,6};
System.out.println("Original array: "+toString(arr));
int[][] leftRight = lesserLeftRight(arr);
System.out.println("Lesser left count: "+toString(leftRight[0]));
System.out.println("Greater right cnt: "+toString(leftRight[1]));
}
public static String toString(int[] arr){
String result = "[";
for(int num: arr){
if(result.length()!=1){
result+=", ";
}
result+=num;
}
result+="]";
return result;
}
public static void reset(){
Arrays.fill(fArr,0);
}
public static void update(int idx, int val){
while(idx < MAX_VALUE){
fArr[idx]+=val;
idx += (idx & -idx);
}
}
public static int cntSum(int idx){
int result = 0;
while(idx > 0){
result += fArr[idx];
idx -= (idx & -idx);
}
return result;
}
public static int[] lesserLeftCount(int[] arr){
reset();
int[] result = new int[arr.length];
for(int i=0; i<arr.length; i++){
result[i] = cntSum(arr[i]-1);
if(cntSum(arr[i])==result[i]) update(arr[i],1);
}
return result;
}
public static int[][] lesserLeftRight(int[] arr){
int[] left = new int[arr.length];
int min = Integer.MAX_VALUE;
for(int i=0; i<arr.length; i++){
left[i] = arr[i];
if(min>arr[i]) min=arr[i];
}
for(int i=0; i<arr.length; i++) left[i]+=min+1;
left = lesserLeftCount(left);
int[] right = new int[arr.length];
int max = Integer.MIN_VALUE;
for(int i=0; i<arr.length; i++){
right[i] = arr[arr.length-1-i];
if(max<right[i]) max=right[i];
}
for(int i=0; i<arr.length; i++) right[i] = max+1-right[i];
right = lesserLeftCount(right);
int[] rightFinal = new int[right.length];
for(int i=0; i<right.length; i++) rightFinal[i] = right[right.length-1-i];
return new int[][]{left, rightFinal};
}
}
这将产生相同的结果。
n < M
,则无法争辩 M
是一个常数 - 或者更确切地说,如果您这样做,则 n
也是常数,您的算法将变为 O(1)
。因此,我要么认为 M
是常数,我们计划处理巨大的 n
,要么在 n
和 M
中表达复杂度。无论哪种方式,都做得很好。 - Erik P.O(N lg(N))
,不需要假设输入是有限整数集合(特别地,它适用于任何有序数据类型)。lowleft[i]
最终会包含满足条件的不同值x[j]
的数量,其中j < i
且x[j] < x[i]
,highright[i]
最终会包含满足条件的不同值x[j]
的数量,其中j > i
且x[j] > x[i]
。x[i]
,我们将其输入到平衡树中(在最后,这棵树中有O(N)
个条目,因此这一步需要O(lg(N))
的时间)。在搜索要输入x[i]
的位置时,我们通过将所有左子树的大小相加以及添加x[i]
左子树的大小来跟踪小于x[i]
的值的数量,并将此数字输入到lowleft[i]
中。x[i]
已经在树中,我们只需继续进行下一次迭代。如果值x[i]
不在其中,我们将其输入并重新平衡树,注意正确更新子树大小。O(lg(N))
步,总共需要O(N lg(N))
。现在我们从一个空树开始,通过反向迭代数组执行相同的操作,找到每个x[i]
在树中的位置,并记录新节点右侧所有子树的大小作为highright[i]
。因此总复杂度为O(N lg(N))
。x[0..i)
中小于x[i]
的不同值的数量。 - Erik P.以下是一个能够为您提供 O(NlgN)
的算法:
遍历列表一次并构建一个映射(map)的 key => indexList
。因此,对于每个键(数组中的元素),您将存储该键在数组中的所有索引的列表。这需要 O(N)
步骤(遍历列表)+ N*O(1)
步骤(将 N 个项目附加到列表)。因此,此步骤为 O(N)
。第二步要求对这些列表进行排序,它们将被排序,因为我们从左到右遍历列表,因此插入列表中的新索引始终大于已经存在的其他索引。
再次遍历列表,并为每个元素搜索索引列表,以获取所有大于当前元素的键的第一个索引,该索引位于当前索引之后。这将为您提供当前元素右侧的大于当前元素的元素的数量。由于索引列表是排序的,因此可以进行二进制搜索,这将需要 O(k * lgN)
步骤,其中 k
是大于当前元素的键数。如果键数有上限,则就大-O而言它是一个常量。第二步是搜索所有较小的键,并找到在当前键之前的列表中的第一个索引。这将为您提供当前元素左侧的小于当前元素的元素数。上述原因相同,这是 O(k * lgN)
O(N) + N * 2 * O(lgN)
,所以总体上是O(NlgN)
,如果我没有弄错的话。
编辑:伪代码:int[] list;
map<int => int[]> valueIndexMap;
foreach (int i = 0; i < list.length; ++i) { // N iterations
int currentElement = list[i]; // O(1)
int[] indexList = valueIndexMap[currentElement]; // O(1)
indexList.Append(i); // O(1)
}
foreach (int i = 0; i < list.length; ++i) { // N iterations
int currentElement = list[i]; // O(1)
int numElementsLargerToTheRight;
int numElementsSmallerToTheLeft;
foreach (int k = currentElement + 1; k < maxKeys; ++k) { // k iterations with k being const
int[] indexList = valueIndexMap[k]; // O(1)
int firstIndexBiggerThanCurrent = indexList.BinaryFindFirstEntryLargerThan(i); // O(lgN)
numElementsLargerToTheRight += indexList.Length - firstIndexBiggerThanCurrent; // O(1)
}
foreach (int k = currentElement - 1; k >= 0; --k) { // k iterations with k being const
int[] indexList = valueIndexMap[k]; // O(1)
int lastIndexSmallerThanCurrent = indexList.BinaryFindLastEntrySmallerThan(i); // O(lgN)
numElementsSmallerToTheLeft += lastIndexSmallerThanCurrent; // O(1)
}
}
更新:如果有人感兴趣,我在 C# 实现方面进行了一些尝试(链接);
k
的大小并不重要。就大O表示法而言,它是一个常数,因为它不取决于数组中元素的数量。 - ChrisWueO(N)
时间,因此您提出的方案是O(N^2)
。这可以通过使用平衡树来修复-然后您将获得O(N lg(N))
(对于固定的k
)。 - Erik P.O(1)
的。 - ChrisWue