将一个有序区间序列定位到另一个固定区间序列以实现最大对齐

Question

将一个有序区间序列定位到另一个固定区间序列以实现最大对齐

6

我有两个间隔序列。

第一个是固定的且不重叠，类似于：

[1..10], [12..15], [23..56], [72..89], ...

第二个不是固定的，因此它只是一个区间长度的有序列表：

[7, 2, 5, 26, ...]

手头的任务是：

将第二个列表中的每个区间放置在给定的起始点，使得第二个列表成为一个固定的、不重叠的区间列表，就像第一个列表一样，并保持其顺序
找到最小化整数数量的对齐方式，这些整数在其中一个列表的某个区间中，但不在另一个列表的任何区间中

非常简单的例子：

[25..26], [58..68], [74..76], [78..86]

[10, 12]

最优的解决方案是将长度为10的区间放置在[58..68]处，将长度为12的区间放置在[74..86]处，这样只有数字25、26和77在一个列表中而不在另一个列表中。

我能想到的唯一有点帮助的事情是，如果我按顺序放置区间，我知道已经创建的区间有多少“惩罚”，因此我有一个上限分数，这意味着我有一个可接受的启发式，并且我可以进行A*搜索而不是查看整个树。然而，数字的总范围从0到约3400万，所以我需要更好的方法。

任何帮助都会很热情！

- user3099140

有趣的问题。这与最佳适配内存分配不完全相同，因为您希望针对整个集合进行最佳适配，而不仅仅是一次一个长度，但它类似于您可用范围不重叠。您实际上并不关心使用哪个块，因此等长块是可替换的；这应该让您执行更简单的搜索，然后扩展结果。预先计算组合长度的存在（即，在微不足道的情况下知道如果任何范围可以接受长度为24，那么这立即是一个最优解）也可能加快速度。...玩得开心.... - keshlam

我闻到了动态规划的味道.. - phs

关于动态规划，我没有看到它。如果递归函数的定义是在固定一个区间后查找最佳匹配，则问题没有相同的子问题（即根据放置第一个区间的位置不同，放置其他区间是不同的任务）。 - user3099140

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- David Knipe · Answer 1

好的，这里是一个半成品的答案。它应该可以在多项式时间内运行，但我没有费心去检查索引是什么。可能有可能获得比这里概述的答案更好的索引。细节留给读者作为练习 :-) 希望不会太不清楚。

我将定义解决方案的分数为出现在两个区间列表中的整数数量。让f(i,m)表示仅使用前i个区间长度时可以获得的最高分数，条件是您的任何区间都不超过m。对于固定的i，函数f本质上是从整数到整数的有界子集的（非严格）递增函数。因此：

所有f(i,m)的值，对于m>0，都相等，除了有限个例外；
所有f(i,m)的值，对于m<0，都相等，除了有限个例外。

这意味着可以使用有限的数据结构来表示f(i,m)的所有值（仍然考虑固定的i）。

现在让F(i)成为表示所有f(i,m)值的数据结构。我声称，如果给定F(i)，就可以计算出F(i+1)。为此，我们只需要回答所有x的以下问题：如果我将新区间放在x处，我能得到最好的解决方案有多好？但是我们知道这是什么——它只是f(i,x)加上我们从该区间获得的分数。

因此，如果第二个列表中的区间数为n，则最佳解决方案的分数将是F(n)。

要实际找到解决方案，您可以从后往前工作。

您知道可以获得的最高分数。假设它是s_0。然后将最后一个区间尽可能向左放置，以满足允许您获得s_0的条件。也就是说，找到最小的m使得f(n,m)=s_0；并将区间放置在仅留在m边界内的位置。

接下来，让 s_1 成为你需要从所有其他区间中获得的分数，以便获得总分 s_0。将倒数第二个区间尽可能向左放置，但仍需满足能够获得 s_1 的条件。也就是说，找到最小的 m 使得 f(n,m) = s_1；并将该区间放置在恰好留在 m 边界内。

如此往复...