为什么Dijkstra算法要使用减小关键字（decrease-key）？

Question

为什么Dijkstra算法要使用减小关键字（decrease-key）？

algorithmdata-structurespriority-queuegraph-algorithmdijkstra

109

我学习的迪杰斯特拉算法如下所示

while pqueue is not empty:
    distance, node = pqueue.delete_min()
    if node has been visited:
        continue
    else:
        mark node as visited
    if node == target:
        break
    for each neighbor of node:
         pqueue.insert(distance + distance_to_neighbor, neighbor)

但是我已经阅读了一些与该算法相关的内容，许多版本我看到都使用decrease-key而不是insert。

为什么会这样，以及这两种方法之间有什么区别？

- weeb

18

Downvoter- 你能否解释一下这个问题有什么问题吗？我认为它非常公正，而且很多人（包括我）最初接触的是 OP 版本的 Dijkstra 算法，而不是 decrease-key 版本。 - templatetypedef

3个回答

35

在2007年，有一篇论文研究了使用减少键版本和插入版本之间执行时间的差异。请参见http://www.cs.sunysb.edu/~rezaul/papers/TR-07-54.pdf

他们的基本结论是大多数情况下不要使用减少键来处理图形。特别是对于稀疏图形，非减少键比减少键版本快得多。更多细节请参见该论文。

- Marc Meketon

8

http://www.cs.sunysb.edu/~rezaul/papers/TR-07-54.pdf‎ 是该论文的有效链接。 - Simd

3

警告：在链接的论文中存在一个错误。第16页，函数B.2：if k < d[u] 应该改为 if k <= d[u]。 - Xeverous

https://www3.cs.stonybrook.edu/~rezaul/papers/TR-07-54.pdf - qwr

3

有两种方法可以实现Dijkstra算法：一种使用支持减少键的堆，另一种使用不支持减少键的堆。

它们在一般情况下都是有效的，但后者通常更受欢迎。接下来我将使用“m”表示我们图形的边数，“n”表示顶点数：

如果您想要最佳的最坏情况复杂度，您可以选择支持减少键的斐波那契堆：您将获得一个漂亮的O（m + nlogn）。

如果您关心平均情况，您也可以使用二进制堆：您将获得O（m + nlog（m / n）logn）。证明在here，99/100页。如果图形是密集的（m >> n），这两个都倾向于O（m）。

如果您想知道在实际图形上运行它们会发生什么，请查看this论文，正如Mark Meketon在他的答案中建议的那样。

实验结果将显示，在大多数情况下，“简单”的堆会给出最佳结果。

事实上，在使用 decrease-key 的实现中，当使用简单的二叉堆或成对堆时，Dijkstra 的表现要优于使用 Fibonacci 堆。这是因为 Fibonacci 堆涉及更大的常数因子，并且实际 decrease-key 操作的数量往往比最坏情况预测的少得多。

出于类似的原因，一个不需要支持 decrease-key 操作的堆，具有更小的常数因子，实际上表现最佳。特别是当图形稀疏时。

- Nicola Amadio

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- templatetypedef · Accepted Answer

使用 decrease-key 而不是重新插入节点的原因是为了保持优先队列中节点数量的少，从而保持总优先队列出队操作的少和每个优先队列平衡的成本低。

在 Dijkstra 算法的实现中，如果将节点与它们的新优先级重新插入到优先队列中，则对于图中的每个 m 条边都会添加一个节点到优先队列中。这意味着在优先队列上有 m 个入队操作和 m 个出队操作，给出了总运行时间 O(m T_e + m T_d)，其中 T_e 是将元素入队到优先队列所需的时间，T_d 是从优先队列中取出元素所需的时间。

在支持降低关键字的Dijkstra算法实现中，持有节点的优先队列起始时有n个节点，并且在算法的每个步骤中移除一个节点。这意味着堆出队的总数是n。每个节点可能会被调用一次或多次降低关键字，导致降低关键字的总数最多为m。这给出了运行时间（n T_e + n T_d + m T_k），其中T_k是调用降低关键字所需的时间。

那么这对运行时间有什么影响呢？这取决于您使用的优先队列。以下是一个快速表格，展示了不同优先队列和不同Dijkstra算法实现的总运行时间：

Queue          |  T_e   |  T_d   |  T_k   | w/o Dec-Key |   w/Dec-Key
---------------+--------+--------+--------+-------------+---------------
Binary Heap    |O(log N)|O(log N)|O(log N)| O(M log N)  |   O(M log N)
Binomial Heap  |O(log N)|O(log N)|O(log N)| O(M log N)  |   O(M log N)
Fibonacci Heap |  O(1)  |O(log N)|  O(1)  | O(M log N)  | O(M + N log N)

从大多数优先队列的类型来看，它们在渐近运行时间上并没有什么区别，并且使用 decrease-key 版本也不太可能有更好的表现。然而，如果您使用 Fibonacci 堆实现优先队列，那么使用 decrease-key 时 Dijkstra 算法将在渐近意义下更加高效。

简而言之，使用 decrease-key 和一个好的优先队列可以将 Dijkstra 的渐近运行时间降低到比继续进行入队和出队更低的水平。

除此之外，一些更高级的算法，如 Gabow 的最短路径算法，将 Dijkstra 算法作为子程序并且严重依赖于 decrease-key 的实现。它们利用了事先知道有效距离范围的事实，可以基于这个事实构建超级高效的优先队列。

希望这能帮到您！