如何找到最长的受限子序列

6
给定一个包含N个不同整数的数组,找到满足以下条件的最长子序列:
1. 子序列的起始元素是子序列中最小的元素。 2. 子序列的结束元素是子序列中最大的元素。
例如:8,1,9,4,7。答案是1,4,7。2,6,5,4,9,8。答案是2,6,5,4,9或2,6,5,4,8。这里有一个O(N²)的算法: - 令X为数字数组。 - 遍历X。假设我们在索引i处。让Y成为数组,其中Y[j]是(j,i]中比X[j]小的元素的数量。让z成为[i,j]中比X[i]小的元素的数量。如果X[j]比X[i]小,我们可以得到一个长度为z-Y[j]的满足约束条件的子序列。 - 将z设置为1。从i-1向下循环j。如果X[j]
我们是否能更好地做到?我认为有一种O(NlogN)的算法来找到最大长度。

作业应该被标记为作业,并且不应该寻求解决方案,而是关于现有解决方案的问题。 - outis
1个回答

1
让我重新解释一下这个O(n log n)算法。
将输入序列的元素解释为2D中的点,其中x坐标是索引,y坐标是值。我们正在寻找包含最多输入点的矩形,但要求左下角和右上角为输入点。在通常的分量偏序下,最佳矩形的左下角是最小的,右上角是最大的。
进行两个线性扫描以查找最小和最大点。创建一个整数值段树,以前者为键,具有接受键区间并增加/减少相关值的操作以及计算最大值的操作。该算法是通过从左到右迭代最大点,并使用段树跟踪位于每个最小点和当前最大点之间(相对于偏序)的输入点数来实现的。

随着我们从左向右移动,最小点和最大点都会下降。假设我们正在从一个最大点 (x, y) 移动到下一个最大点 (x', y')。我们有 x < x' 和 y' < y。线段树中的值会如何改变?由于 x < x',x 坐标在 ]x, x'] 中的点不属于右上角为 (x, y) 的矩形,但可能属于右上角为 (x', y') 的矩形。相反,由于 y' < y,y 坐标在 ]y', y] 中的点可能属于右上角为 (x, y) 的矩形,但不属于右上角为 (x', y') 的矩形。其他所有点不受影响。

----+                   empty
    |
----+---------+ (x, y)
      removed |
--------------+-------+ (x', y')
              | added |
              |       +----+
              |       |    |

我们逐个检查可能受影响的点,并更新线段树。点按x排序;如果我们在初始化过程中复制并按y排序,则可以有效地枚举可能受影响的点。请注意,随着时间的推移,x区间成对不相交,y区间也是如此,因此我们可以花费对数时间处理每个可能受影响的点。给定一个点(x'', y''),使得x''∈]x,x'](注意,在这种情况下,y'' ≤ y'),我们需要在x坐标在]inf,x'']以及y坐标在]inf,y'']范围内的最小点处增加线段树。这看起来不是一维的,但实际上最小点的x坐标排序和y坐标排序是相反的,因此这组键是一个区间。同样,给定一个点(x''', y'''),使得y'''∈]y',y](注意,在这种情况下,x''' ≤ x),我们需要减少一个键的值的区间。
以下是Java中“神奇”的线段树数据结构。
public class SegmentTree {
    private int n;
    private int m;
    private int[] deltaValue;
    private int[] deltaMax;

    private static int nextHighestPowerOfTwoMinusOne(int n) {
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return n;
    }

    public SegmentTree(int n) {
        this.n = n;
        m = nextHighestPowerOfTwoMinusOne(n) + 1;
        deltaValue = new int[m];
        deltaMax = new int[m];
    }

    private static int parent(int i) {
        int lob = i & -i;
        return (i | (lob << 1)) - lob;
    }

    private static int leftChild(int i) {
        int lob = i & -i;
        return i - (lob >>> 1);
    }

    private static int rightChild(int i) {
        int lob = i & -i;
        return i + (lob >>> 1);
    }

    public int get(int i) {
        if (i < 0 || i > n) {
            throw new IllegalArgumentException();
        }
        if (i == 0) {
            return 0;
        }
        int sum = 0;
        do {
            sum += deltaValue[i];
            i = parent(i);
        } while (i < m);
        return sum;
    }

    private int root() {
        return m >>> 1;
    }

    private int getMax(int i) {
        return deltaMax[i] + deltaValue[i];
    }

    public void addToSuffix(int i, int delta) {
        if (i < 1 || i > n + 1) {
            throw new IllegalArgumentException();
        }
        if (i == n + 1) {
            return;
        }
        int j = root();
        outer:
        while (true) {
            while (j < i) {
                int k = rightChild(j);
                if (k == j) {
                    break outer;
                }
                j = k;
            }
            deltaValue[j] += delta;
            do {
                int k = leftChild(j);
                if (k == j) {
                    break outer;
                }
                j = k;
            } while (j >= i);
            deltaValue[j] -= delta;
        }
        while (true) {
            j = parent(j);
            if (j >= m) {
                break;
            }
            deltaMax[j] =
                Math.max(0,
                         Math.max(getMax(leftChild(j)),
                                  getMax(rightChild(j))));
        }
    }

    public int maximum() {
        return getMax(root());
    }
}

我认为你假设子数组是连续的,但实际上可能并不是。 - Amos
谢谢,David。_starters_和_enders_很明显。但是你对_candidates_的定义以及选择它们的方式很难理解。伪代码会帮助很多。 - Amos
再次感谢!看起来是个很不错的答案。所以基本思路是建立一个神奇的线段树,每个“候选人”只需要对它执行一次操作。但我不太明白如何实现这个树,而且我有一个小疑问,整体复杂度是否渐进于 O(n log n)。 - Amos
@amos 这不是魔法。对于线段树中的批量添加,每个线段都有一个关联的数量 delta_value。点的值是它所在的所有线段的 delta_values 的总和。现在,对于每个线段 s,维护一个 delta_max 字段,即 s 中点的最大值减去 s 及其祖先的 delta_values 的总和。然后,具有两个子节点 s1 和 s2 的线段 s 的方程为 delta_max(s) = max(delta_max(s1) + delta_value(s1), delta_max(s2) + delta_value(s2))。如果将更新推迟到批量添加结束时,则 delta_max 的必要更新为 O(log n)。 - David Eisenstat
我花了一个早上复习线段树,但我仍然不明白你用来设计这棵树的思想。有关于线段树使用的相关主题吗?或者你能画一些图解释得更详细一些吗?这将非常有帮助。谢谢! - Amos

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接