计算数组位置的较小和较大值

3
我有一个需要优化的问题。对于一个给定的数组(允许重复键),对于数组中的每个位置i,我需要计算在i右边的所有更大的值和在i左边的所有更小的值。如果我们有:
1 1 4 3 5 6 7和i = 3(值为3),在i左边的较小值的数量是1(没有重复键),在右边,较大值的数量为3。
这个问题的暴力解决方案是~N^2,通过一些额外的空间,我可以处理从较大值计算出较小值,从而将复杂度降低到~(N^2)/2。 我的问题是:有没有更快的方法来完成它?也许是NlgN?我想象中有一个数据结构可以让我更快地进行计算。
编辑:感谢大家的回复和讨论。您可以在下面找到两个好的解决方案。总是很高兴从stackoverflow的开发人员中学习。

1
有问题的代码在哪里? - Serkan Arıkuşu
1
(1) 请发布您正在使用的实际代码;与叙述相比,这样更容易明确地理解。(2) 这可能更适合 Code Review 而不是 Stack Overflow。(3) 尽管您可能能够取得重大改进,但从 N^2 到 N^2/2 是一个线性因子,因此您仍然是 O(N^2)。 - chrylis -cautiouslyoptimistic-
1
问题对我来说很明确,他正在寻求比暴力算法更好的算法。 - arynaq
暴力搜索算法的代码非常简单:使用for循环嵌套两个内部循环,一个向右,一个向左,并进行计数。就是这样。是的,我想问是否有一种方法可以改进O(N^2)的时间复杂度。@ Zong Zheng Li,你能详细说明吗?哈希集合可以避免重复计数,但我不知道它如何提高整体性能。 - Moises B.
4个回答

3

这里提供了一个时间复杂度为 O(n log n) 的解决方案。

正如 @SayonjiNakate 所提示的那样,使用线段树(我在我的实现中使用了 Fenwick 树)的解决方案的时间复杂度为 O(n log M),其中 M 是数组中可能的最大值。

首先,请注意,“左侧较小元素数目”这个问题可以通过对数组进行反转和否定来等效于“右侧较大元素数目”的问题。 因此,在下面的解释中,我只描述了“左侧较小元素数目”,我称之为“lesser_left_count”。

算法 lesser_left_count:

思路是能够找到小于特定数字的总数。

  1. 定义一个大小为MAX_VALUE的数组tree,用于存储已出现过的数字值为1,否则为0

  2. 遍历数组时,当我们看到一个数字num,只需将值1赋给tree[num]更新操作)。此时,数字num左侧小于它的数的数量为目前为止从1num-1的和(求和操作),因为所有比当前位置左侧更小的数字都已被设置为1

简单吧?如果我们使用Fenwick tree,则更新和求和操作可以在O(log M)时间内完成,其中M是数组中可能的最大值。由于我们正在迭代整个数组,因此总时间复杂度为O(n log M)

这种朴素的解决方案唯一的缺点是,随着M变大(我在代码中设置了M=2^20-1,大约需要4MB的内存),它使用了很多内存。可以通过将数组中的不同整数映射到较小的整数(以保留顺序的方式)来改进此问题。通过对数组进行排序,可以简单地在O(n log n)时间内完成映射。因此,数字M可以重新解释为“数组中不同元素的数量”。
所以内存不再是任何问题,因为如果在这种改进之后确实需要大量内存,那意味着您的数组中有那么多不同的数字,并且O(n)的时间复杂度已经太高无法在正常机器上计算。
为了简单起见,我没有在我的代码中包含这种改进。
哦,由于Fenwick树仅适用于正数,因此我将数组中的数字转换为最小值为1。请注意,这不会改变结果。
Python代码:
MAX_VALUE = 2**20-1
f_arr = [0]*MAX_VALUE

def reset():
    global f_arr, MAX_VALUE
    f_arr[:] = [0]*MAX_VALUE

def update(idx,val):
    global f_arr
    while idx<MAX_VALUE:
        f_arr[idx]+=val
        idx += (idx & -idx)

def cnt_sum(idx):
    global f_arr
    result = 0
    while idx > 0:
        result += f_arr[idx]
        idx -= (idx & -idx)
    return result

def count_left_less(arr):
    reset()
    result = [0]*len(arr)
    for idx,num in enumerate(arr):
        cnt_prev = cnt_sum(num-1)
        if cnt_sum(num) == cnt_prev: # If we haven't seen num before
            update(num,1)
        result[idx] = cnt_prev
    return result

def count_left_right(arr):
    arr = [x for x in arr]
    min_num = min(arr)
    if min_num<=0:                       # Got nonpositive numbers!
        arr = [min_num+1+x for x in arr] # Convert to minimum 1
    left = count_left_less(arr)
    arr.reverse()                        # Reverse for greater_right_count
    max_num = max(arr)
    arr = [max_num+1-x for x in arr]     # Negate the entries, keep minimum 1
    right = count_left_less(arr)
    right.reverse()                      # Reverse the result, to align with original array
    return (left, right)

def main():
    arr = [1,1,3,2,4,5,6]
    (left, right) = count_left_right(arr)
    print 'Array: ' + str(arr)
    print 'Lesser left count: ' + str(left)
    print 'Greater right cnt: ' + str(right)

if __name__=='__main__':
    main()

将产生:

原始数组:[1, 1, 3, 2, 4, 5, 6]
较小的左计数:[0, 0, 1, 1, 3, 4, 5]
较大的右计数:[5, 5, 3, 3, 2, 1, 0]

或者如果您想要Java代码:

import java.util.Arrays;

class Main{
    static int MAX_VALUE = 1048575;
    static int[] fArr = new int[MAX_VALUE];

    public static void main(String[] args){
        int[] arr = new int[]{1,1,3,2,4,5,6};
        System.out.println("Original array:    "+toString(arr));
        int[][] leftRight = lesserLeftRight(arr);
        System.out.println("Lesser left count: "+toString(leftRight[0]));
        System.out.println("Greater right cnt: "+toString(leftRight[1]));
    }

    public static String toString(int[] arr){
        String result = "[";
        for(int num: arr){
            if(result.length()!=1){
                result+=", ";
            }
            result+=num;
        }
        result+="]";
        return result;
    }

    public static void reset(){
        Arrays.fill(fArr,0);
    }

    public static void update(int idx, int val){
        while(idx < MAX_VALUE){
            fArr[idx]+=val;
            idx += (idx & -idx);
        }
    }

    public static int cntSum(int idx){
        int result = 0;
        while(idx > 0){
            result += fArr[idx];
            idx -= (idx & -idx);
        }
        return result;
    }

    public static int[] lesserLeftCount(int[] arr){
        reset();
        int[] result = new int[arr.length];
        for(int i=0; i<arr.length; i++){
            result[i] = cntSum(arr[i]-1);
            if(cntSum(arr[i])==result[i]) update(arr[i],1);
        }
        return result;
    }

    public static int[][] lesserLeftRight(int[] arr){
        int[] left = new int[arr.length];
        int min = Integer.MAX_VALUE;
        for(int i=0; i<arr.length; i++){
            left[i] = arr[i];
            if(min>arr[i]) min=arr[i];
        }
        for(int i=0; i<arr.length; i++) left[i]+=min+1;
        left = lesserLeftCount(left);

        int[] right = new int[arr.length];
        int max = Integer.MIN_VALUE;
        for(int i=0; i<arr.length; i++){
            right[i] = arr[arr.length-1-i];
            if(max<right[i]) max=right[i];
        }
        for(int i=0; i<arr.length; i++) right[i] = max+1-right[i];
        right = lesserLeftCount(right);
        int[] rightFinal = new int[right.length];
        for(int i=0; i<right.length; i++) rightFinal[i] = right[right.length-1-i];
        return new int[][]{left, rightFinal};
    }
}

这将产生相同的结果。


1
这是一个很好的解决方案,尽管如果您假设 n < M,则无法争辩 M 是一个常数 - 或者更确切地说,如果您这样做,则 n 也是常数,您的算法将变为 O(1)。因此,我要么认为 M 是常数,我们计划处理巨大的 n,要么在 nM 中表达复杂度。无论哪种方式,都做得很好。 - Erik P.
@ErikP.,经过7年,我更新了我的答案以删除那个误导性的陈述。 - justhalf

2
这里有一个比较简单的解决方案,时间复杂度为O(N lg(N)),不需要假设输入是有限整数集合(特别地,它适用于任何有序数据类型)。
我们假设输出要存储在两个数组中;lowleft[i]最终会包含满足条件的不同值x[j]的数量,其中j < ix[j] < x[i]highright[i]最终会包含满足条件的不同值x[j]的数量,其中j > ix[j] > x[i]
创建一个平衡树数据结构,在每个节点中维护以该节点为根的子树中的节点数。这是相当标准的,但我认为它不是Java标准库的一部分;最简单的方式可能是使用AVL树。节点中的值的类型应该与数组中的值的类型相同。
现在首先正向迭代数组。我们从一个空的平衡树开始。对于我们遇到的每个值x[i],我们将其输入到平衡树中(在最后,这棵树中有O(N)个条目,因此这一步需要O(lg(N))的时间)。在搜索要输入x[i]的位置时,我们通过将所有左子树的大小相加以及添加x[i]左子树的大小来跟踪小于x[i]的值的数量,并将此数字输入到lowleft[i]中。
如果值x[i]已经在树中,我们只需继续进行下一次迭代。如果值x[i]不在其中,我们将其输入并重新平衡树,注意正确更新子树大小。
这个循环的每次迭代需要O(lg(N))步,总共需要O(N lg(N))。现在我们从一个空树开始,通过反向迭代数组执行相同的操作,找到每个x[i]在树中的位置,并记录新节点右侧所有子树的大小作为highright[i]。因此总复杂度为O(N lg(N))

是的,那可能是个好的解决方案,但如果我理解正确的话会出现一个问题:对于数组1 5 4 3 6 5 9 10,第一个5后面的大数是6,但第二个5后面并没有比它更大的数。因此,对于第二个5,我们将得到一个不符合要求的+1值。我想是这样的。谢谢。 - Moises B.
对于“highright”条目,您需要在数组中向迭代(第二次遍历)。所以早期您将遇到最右边的5,并且会发现有一个数字比您的树中的数字更大(即9),稍后您会遇到最左边的5并看到数字6和9是您的树中比其更大的数字。 - Erik P.

2

尝试使用线段树数据结构来解决RMQ问题。

这将使您的复杂度达到精确的n log n。

并且通常查看RMQ问题,您的问题可能会被简化为它。

同时请查看最近公共祖先问题


愿意解释一下吗? 我不明白这个问题如何归约为RMQ,也不清楚如何使用线段树来计算x[0..i)中小于x[i]的不同值的数量。 - Erik P.
1
这在我的答案中有详细说明,使用树状数组代替线段树(两者等效)。 - justhalf

0

以下是一个能够为您提供 O(NlgN) 的算法:

  1. 遍历列表一次并构建一个映射(map)的 key => indexList。因此,对于每个键(数组中的元素),您将存储该键在数组中的所有索引的列表。这需要 O(N) 步骤(遍历列表)+ N*O(1) 步骤(将 N 个项目附加到列表)。因此,此步骤为 O(N)。第二步要求对这些列表进行排序,它们将被排序,因为我们从左到右遍历列表,因此插入列表中的新索引始终大于已经存在的其他索引。

  2. 再次遍历列表,并为每个元素搜索索引列表,以获取所有大于当前元素的键的第一个索引,该索引位于当前索引之后。这将为您提供当前元素右侧的大于当前元素的元素的数量。由于索引列表是排序的,因此可以进行二进制搜索,这将需要 O(k * lgN) 步骤,其中 k 是大于当前元素的键数。如果键数有上限,则就大-O而言它是一个常量。第二步是搜索所有较小的键,并找到在当前键之前的列表中的第一个索引。这将为您提供当前元素左侧的小于当前元素的元素数。上述原因相同,这是 O(k * lgN)

假设键的数量有限,那么这应该会给你O(N) + N * 2 * O(lgN),所以总体上是O(NlgN),如果我没有弄错的话。 编辑:伪代码:
int[] list;
map<int => int[]> valueIndexMap;
foreach (int i = 0; i < list.length; ++i) {       // N iterations
   int currentElement = list[i];                     // O(1)
   int[] indexList = valueIndexMap[currentElement];  // O(1)
   indexList.Append(i);                              // O(1)
}

foreach (int i = 0; i < list.length; ++i) {  // N iterations
    int currentElement = list[i];            // O(1)
    int numElementsLargerToTheRight;
    int numElementsSmallerToTheLeft;
    foreach (int k = currentElement + 1; k < maxKeys; ++k) {  // k iterations with k being const
       int[] indexList = valueIndexMap[k];                                            // O(1)
       int firstIndexBiggerThanCurrent = indexList.BinaryFindFirstEntryLargerThan(i); // O(lgN)
       numElementsLargerToTheRight += indexList.Length - firstIndexBiggerThanCurrent;  // O(1)
    }
    foreach (int k = currentElement - 1; k >= 0; --k) {  // k iterations with k being const
       int[] indexList = valueIndexMap[k];                                            // O(1)
       int lastIndexSmallerThanCurrent = indexList.BinaryFindLastEntrySmallerThan(i); // O(lgN)
       numElementsSmallerToTheLeft += lastIndexSmallerThanCurrent;                    // O(1)
    }
}

更新:如果有人感兴趣,我在 C# 实现方面进行了一些尝试(链接)


我不明白你在这里做什么。从伪代码中可以看出,你的第一部分是将一个元素放入每个数组中并映射到相应的键。 - justhalf
不,它记录了数组中每个键被找到的所有索引。 - ChrisWue
1
不,我的意思是k的大小并不重要。就大O表示法而言,它是一个常数,因为它不取决于数组中元素的数量。 - ChrisWue
1
如果您将元素插入已排序的列表中,则需要O(N)时间,因此您提出的方案是O(N^2)。这可以通过使用平衡树来修复-然后您将获得O(N lg(N))(对于固定的k)。 - Erik P.
1
@ErikP。嗯,实际上列表将自动排序,因为如果我们从左到右循环,索引将始终增加。因此不需要任何特殊操作。并且向列表添加元素是O(1)的。 - ChrisWue
显示剩余5条评论

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接