计算数组位置的较小和较大值

Question

计算数组位置的较小和较大值

javaarraysalgorithmoptimizationdata-structures

3

我有一个需要优化的问题。对于一个给定的数组（允许重复键），对于数组中的每个位置i，我需要计算在i右边的所有更大的值和在i左边的所有更小的值。如果我们有：

1 1 4 3 5 6 7和i = 3（值为3），在i左边的较小值的数量是1（没有重复键），在右边，较大值的数量为3。

这个问题的暴力解决方案是~N^2，通过一些额外的空间，我可以处理从较大值计算出较小值，从而将复杂度降低到~（N^2）/2。我的问题是：有没有更快的方法来完成它？也许是NlgN？我想象中有一个数据结构可以让我更快地进行计算。

编辑：感谢大家的回复和讨论。您可以在下面找到两个好的解决方案。总是很高兴从stackoverflow的开发人员中学习。

- Moises B.

1

有问题的代码在哪里？ - Serkan Arıkuşu

1

(1) 请发布您正在使用的实际代码；与叙述相比，这样更容易明确地理解。(2) 这可能更适合 Code Review 而不是 Stack Overflow。(3) 尽管您可能能够取得重大改进，但从 N^2 到 N^2/2 是一个线性因子，因此您仍然是 O(N^2)。 - chrylis -cautiouslyoptimistic-

1

问题对我来说很明确，他正在寻求比暴力算法更好的算法。 - arynaq

暴力搜索算法的代码非常简单：使用for循环嵌套两个内部循环，一个向右，一个向左，并进行计数。就是这样。是的，我想问是否有一种方法可以改进O(N^2)的时间复杂度。@ Zong Zheng Li，你能详细说明吗？哈希集合可以避免重复计数，但我不知道它如何提高整体性能。 - Moises B.

4个回答

2

这里有一个比较简单的解决方案，时间复杂度为O(N lg(N))，不需要假设输入是有限整数集合（特别地，它适用于任何有序数据类型）。

我们假设输出要存储在两个数组中；lowleft[i]最终会包含满足条件的不同值x[j]的数量，其中j < i且x[j] < x[i]，highright[i]最终会包含满足条件的不同值x[j]的数量，其中j > i且x[j] > x[i]。

创建一个平衡树数据结构，在每个节点中维护以该节点为根的子树中的节点数。这是相当标准的，但我认为它不是Java标准库的一部分；最简单的方式可能是使用AVL树。节点中的值的类型应该与数组中的值的类型相同。

现在首先正向迭代数组。我们从一个空的平衡树开始。对于我们遇到的每个值x[i]，我们将其输入到平衡树中（在最后，这棵树中有O(N)个条目，因此这一步需要O(lg(N))的时间）。在搜索要输入x[i]的位置时，我们通过将所有左子树的大小相加以及添加x[i]左子树的大小来跟踪小于x[i]的值的数量，并将此数字输入到lowleft[i]中。

如果值x[i]已经在树中，我们只需继续进行下一次迭代。如果值x[i]不在其中，我们将其输入并重新平衡树，注意正确更新子树大小。

这个循环的每次迭代需要O(lg(N))步，总共需要O(N lg(N))。现在我们从一个空树开始，通过反向迭代数组执行相同的操作，找到每个x[i]在树中的位置，并记录新节点右侧所有子树的大小作为highright[i]。因此总复杂度为O(N lg(N))。

- Erik P.

是的，那可能是个好的解决方案，但如果我理解正确的话会出现一个问题：对于数组1 5 4 3 6 5 9 10，第一个5后面的大数是6，但第二个5后面并没有比它更大的数。因此，对于第二个5，我们将得到一个不符合要求的+1值。我想是这样的。谢谢。 - Moises B.

对于“highright”条目，您需要在数组中向后迭代（第二次遍历）。所以早期您将遇到最右边的5，并且会发现有一个数字比您的树中的数字更大（即9），稍后您会遇到最左边的5并看到数字6和9是您的树中比其更大的数字。 - Erik P.

2

尝试使用线段树数据结构来解决RMQ问题。

这将使您的复杂度达到精确的n log n。

并且通常查看RMQ问题，您的问题可能会被简化为它。

同时请查看最近公共祖先问题。

- Serge Seredenko

愿意解释一下吗？我不明白这个问题如何归约为RMQ，也不清楚如何使用线段树来计算x[0..i)中小于x[i]的不同值的数量。 - Erik P.

1

这在我的答案中有详细说明，使用树状数组代替线段树（两者等效）。 - justhalf

0

以下是一个能够为您提供 O(NlgN) 的算法：

遍历列表一次并构建一个映射（map）的 key => indexList。因此，对于每个键（数组中的元素），您将存储该键在数组中的所有索引的列表。这需要 O(N) 步骤（遍历列表）+ N*O(1) 步骤（将 N 个项目附加到列表）。因此，此步骤为 O(N)。第二步要求对这些列表进行排序，它们将被排序，因为我们从左到右遍历列表，因此插入列表中的新索引始终大于已经存在的其他索引。
再次遍历列表，并为每个元素搜索索引列表，以获取所有大于当前元素的键的第一个索引，该索引位于当前索引之后。这将为您提供当前元素右侧的大于当前元素的元素的数量。由于索引列表是排序的，因此可以进行二进制搜索，这将需要 O(k * lgN) 步骤，其中 k 是大于当前元素的键数。如果键数有上限，则就大-O而言它是一个常量。第二步是搜索所有较小的键，并找到在当前键之前的列表中的第一个索引。这将为您提供当前元素左侧的小于当前元素的元素数。上述原因相同，这是 O(k * lgN)

假设键的数量有限，那么这应该会给你O(N) + N * 2 * O(lgN)，所以总体上是O(NlgN)，如果我没有弄错的话。编辑：伪代码：

int[] list;
map<int => int[]> valueIndexMap;
foreach (int i = 0; i < list.length; ++i) {       // N iterations
   int currentElement = list[i];                     // O(1)
   int[] indexList = valueIndexMap[currentElement];  // O(1)
   indexList.Append(i);                              // O(1)
}

foreach (int i = 0; i < list.length; ++i) {  // N iterations
    int currentElement = list[i];            // O(1)
    int numElementsLargerToTheRight;
    int numElementsSmallerToTheLeft;
    foreach (int k = currentElement + 1; k < maxKeys; ++k) {  // k iterations with k being const
       int[] indexList = valueIndexMap[k];                                            // O(1)
       int firstIndexBiggerThanCurrent = indexList.BinaryFindFirstEntryLargerThan(i); // O(lgN)
       numElementsLargerToTheRight += indexList.Length - firstIndexBiggerThanCurrent;  // O(1)
    }
    foreach (int k = currentElement - 1; k >= 0; --k) {  // k iterations with k being const
       int[] indexList = valueIndexMap[k];                                            // O(1)
       int lastIndexSmallerThanCurrent = indexList.BinaryFindLastEntrySmallerThan(i); // O(lgN)
       numElementsSmallerToTheLeft += lastIndexSmallerThanCurrent;                    // O(1)
    }
}

更新：如果有人感兴趣，我在 C# 实现方面进行了一些尝试（链接）；

- ChrisWue

我不明白你在这里做什么。从伪代码中可以看出，你的第一部分是将一个元素放入每个数组中并映射到相应的键。 - justhalf

不，它记录了数组中每个键被找到的所有索引。 - ChrisWue

1

不，我的意思是k的大小并不重要。就大O表示法而言，它是一个常数，因为它不取决于数组中元素的数量。 - ChrisWue

1

如果您将元素插入已排序的列表中，则需要O(N)时间，因此您提出的方案是O(N^2)。这可以通过使用平衡树来修复-然后您将获得O(N lg(N))（对于固定的k）。 - Erik P.

1

@ErikP。嗯，实际上列表将自动排序，因为如果我们从左到右循环，索引将始终增加。因此不需要任何特殊操作。并且向列表添加元素是O(1)的。 - ChrisWue

显示剩余5条评论

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- justhalf · Accepted Answer

这里提供了一个时间复杂度为 O(n log n) 的解决方案。

正如 @SayonjiNakate 所提示的那样，使用线段树（我在我的实现中使用了 Fenwick 树）的解决方案的时间复杂度为 O(n log M)，其中 M 是数组中可能的最大值。

首先，请注意，“左侧较小元素数目”这个问题可以通过对数组进行反转和否定来等效于“右侧较大元素数目”的问题。因此，在下面的解释中，我只描述了“左侧较小元素数目”，我称之为“lesser_left_count”。

算法 lesser_left_count：

思路是能够找到小于特定数字的总数。

定义一个大小为MAX_VALUE的数组tree，用于存储已出现过的数字值为1，否则为0。
遍历数组时，当我们看到一个数字num，只需将值1赋给tree[num]（更新操作）。此时，数字num左侧小于它的数的数量为目前为止从1到num-1的和（求和操作），因为所有比当前位置左侧更小的数字都已被设置为1。

简单吧？如果我们使用Fenwick tree，则更新和求和操作可以在O(log M)时间内完成，其中M是数组中可能的最大值。由于我们正在迭代整个数组，因此总时间复杂度为O(n log M)。

这种朴素的解决方案唯一的缺点是，随着M变大（我在代码中设置了M=2^20-1，大约需要4MB的内存），它使用了很多内存。可以通过将数组中的不同整数映射到较小的整数（以保留顺序的方式）来改进此问题。通过对数组进行排序，可以简单地在O(n log n)时间内完成映射。因此，数字M可以重新解释为“数组中不同元素的数量”。

所以内存不再是任何问题，因为如果在这种改进之后确实需要大量内存，那意味着您的数组中有那么多不同的数字，并且O(n)的时间复杂度已经太高无法在正常机器上计算。

为了简单起见，我没有在我的代码中包含这种改进。

哦，由于Fenwick树仅适用于正数，因此我将数组中的数字转换为最小值为1。请注意，这不会改变结果。

Python代码：

MAX_VALUE = 2**20-1
f_arr = [0]*MAX_VALUE

def reset():
    global f_arr, MAX_VALUE
    f_arr[:] = [0]*MAX_VALUE

def update(idx,val):
    global f_arr
    while idx<MAX_VALUE:
        f_arr[idx]+=val
        idx += (idx & -idx)

def cnt_sum(idx):
    global f_arr
    result = 0
    while idx > 0:
        result += f_arr[idx]
        idx -= (idx & -idx)
    return result

def count_left_less(arr):
    reset()
    result = [0]*len(arr)
    for idx,num in enumerate(arr):
        cnt_prev = cnt_sum(num-1)
        if cnt_sum(num) == cnt_prev: # If we haven't seen num before
            update(num,1)
        result[idx] = cnt_prev
    return result

def count_left_right(arr):
    arr = [x for x in arr]
    min_num = min(arr)
    if min_num<=0:                       # Got nonpositive numbers!
        arr = [min_num+1+x for x in arr] # Convert to minimum 1
    left = count_left_less(arr)
    arr.reverse()                        # Reverse for greater_right_count
    max_num = max(arr)
    arr = [max_num+1-x for x in arr]     # Negate the entries, keep minimum 1
    right = count_left_less(arr)
    right.reverse()                      # Reverse the result, to align with original array
    return (left, right)

def main():
    arr = [1,1,3,2,4,5,6]
    (left, right) = count_left_right(arr)
    print 'Array: ' + str(arr)
    print 'Lesser left count: ' + str(left)
    print 'Greater right cnt: ' + str(right)

if __name__=='__main__':
    main()

将产生：

原始数组：[1, 1, 3, 2, 4, 5, 6]
较小的左计数：[0, 0, 1, 1, 3, 4, 5]
较大的右计数：[5, 5, 3, 3, 2, 1, 0]

或者如果您想要Java代码：

import java.util.Arrays;

class Main{
    static int MAX_VALUE = 1048575;
    static int[] fArr = new int[MAX_VALUE];

    public static void main(String[] args){
        int[] arr = new int[]{1,1,3,2,4,5,6};
        System.out.println("Original array:    "+toString(arr));
        int[][] leftRight = lesserLeftRight(arr);
        System.out.println("Lesser left count: "+toString(leftRight[0]));
        System.out.println("Greater right cnt: "+toString(leftRight[1]));
    }

    public static String toString(int[] arr){
        String result = "[";
        for(int num: arr){
            if(result.length()!=1){
                result+=", ";
            }
            result+=num;
        }
        result+="]";
        return result;
    }

    public static void reset(){
        Arrays.fill(fArr,0);
    }

    public static void update(int idx, int val){
        while(idx < MAX_VALUE){
            fArr[idx]+=val;
            idx += (idx & -idx);
        }
    }

    public static int cntSum(int idx){
        int result = 0;
        while(idx > 0){
            result += fArr[idx];
            idx -= (idx & -idx);
        }
        return result;
    }

    public static int[] lesserLeftCount(int[] arr){
        reset();
        int[] result = new int[arr.length];
        for(int i=0; i<arr.length; i++){
            result[i] = cntSum(arr[i]-1);
            if(cntSum(arr[i])==result[i]) update(arr[i],1);
        }
        return result;
    }

    public static int[][] lesserLeftRight(int[] arr){
        int[] left = new int[arr.length];
        int min = Integer.MAX_VALUE;
        for(int i=0; i<arr.length; i++){
            left[i] = arr[i];
            if(min>arr[i]) min=arr[i];
        }
        for(int i=0; i<arr.length; i++) left[i]+=min+1;
        left = lesserLeftCount(left);

        int[] right = new int[arr.length];
        int max = Integer.MIN_VALUE;
        for(int i=0; i<arr.length; i++){
            right[i] = arr[arr.length-1-i];
            if(max<right[i]) max=right[i];
        }
        for(int i=0; i<arr.length; i++) right[i] = max+1-right[i];
        right = lesserLeftCount(right);
        int[] rightFinal = new int[right.length];
        for(int i=0; i<right.length; i++) rightFinal[i] = right[right.length-1-i];
        return new int[][]{left, rightFinal};
    }
}

这将产生相同的结果。