C中的内存高效双向链表是什么？

Question

C中的内存高效双向链表是什么？

cdata-structuresmemory-efficientxor-linkedlistmem.-efficient-linkedlist

45

我在读一本有关C数据结构的书时，看到了“内存高效双向链表”这个术语。书中只用了一行字，说一个内存高效的双向链表比普通的双向链表使用更少的内存，但是它们完成相同的工作。没有做进一步解释，也没有给出实例。只是说明这来自一篇期刊文章，“Sinha”括号里面。

在谷歌上搜索后，我找到的最接近的内容是这个。但是，我什么都没懂。

可以有人解释一下，内存高效的双向链表是什么？它与普通的双向链表有什么不同吗？

编辑：好吧，我犯了一个严重的错误。我发的链接其实是文章的第二页，我没有看到有第一页，并且认为给出的链接就是第一页。事实上，文章的第一页提供了一个解释，但我认为并不完美。它只讲了内存高效链表或XOR链表的基础概念。

- Box Box Box Box

5

我不太明白为什么你会想要使用这个，它有什么实际的应用场景呢？如果你有一个包含数千个节点的大型链表，问题不在于内存使用，而是慢速遍历以查找给定元素。这意味着你一开始选择了错误的容器类！使用二叉搜索树或哈希表等可能更合适。 - Lundin

1

@Lundin，我同意。但我从未提到这比双向链表好多少。我只是找不到这个问题的答案，当我找到一个答案时，我想发布一个问题和答案来解释XOR链接列表。这是因为当我不知道这被称为XOR链接列表时，搜索真的很困难，我花了三个小时才弄清楚它到底是什么。 - Box Box Box Box

2

我不是那个点踩者，但你链接到了文章的第二页，而第一页解释了结构并给出了示例代码。 - stark

这些链接提供了一些关于XOR链表的信息：链接1，链接2。 - Subhiksh

@SurajJain http://chat.stackoverflow.com/rooms/134363/room-for-ashish-ahuja-and-suraj-jain（现在让我们清理一下评论） - Box Box Box Box

显示剩余4条评论

5个回答

17

这是一种旧的编程技巧，可以帮助你节省内存。我认为这种方法已经不再被广泛使用了，因为内存不再像早期那样紧缺。

其基本思想是：在传统的双向链表中，你有两个指向相邻列表元素的指针，“next”指针指向下一个元素，“prev”指针指向前一个元素。因此，你可以通过使用适当的指针正向或反向遍历列表。

在减少内存的实现中，你用一个单一的值替换“next”和“prev”，这个值是“next”和“prev”的按位异或(bitwise-XOR)。因此，你减少了相邻元素指针的存储一半。

使用这种技术，仍然可以在任一方向上遍历列表，但是需要知道前一个（或下一个）元素的地址才能这样做。例如，如果你向前遍历列表，并且你有“prev”的地址，则可以通过将当前组合指针值“prev XOR next”与“prev”进行按位异或来获取“next”。结果是“prev XOR prev XOR next”，即“next”。反向遍历也可以这样做。

缺点是，如果你拥有该元素的指针，则无法像通常情况下那样删除元素，需要知道“prev”或“next”元素的地址，因为你没有上下文来解码组合指针值。

另一个缺点是，这种指针技巧规避了编译器可能期望的正常数据类型检查机制。

这是一种聪明的技巧，但老实说，我认为在现代的编程中很少有使用它的理由。

- Tom Karzes

15

我建议查看我的第二个答案，因为它更清晰易懂。但我并不是说这个答案是错误的。这也是正确的。

一种内存高效的链表也被称为XOR链表。

它是如何工作的

XOR(^)链表是一种链表，它不是存储next和back指针，而是只使用一个指针来完成next和back指针的工作。让我们首先看看XOR逻辑门的特性：

|-------------|------------|------------|
|    Name     |   Formula  |    Result  |
|-------------|------------|------------|
| Commutative |    A ^ B   |    B ^ A   |
|-------------|------------|------------|
| Associative | A ^ (B ^ C)| (A ^ B) ^ C|
|-------------|------------|------------|
| None (1)    |    A ^ 0   |     A      |
|-------------|------------|------------|
| None (2)    |    A ^ A   |     0      |
|-------------|------------|------------|
| None (3)    | (A ^ B) ^ A|     B      |
|-------------|------------|------------|

现在让我们举一个例子。我们有一个包含四个节点的双向链表：A, B, C, D。下面是它的样子：

如果您看一下，每个节点都有两个指针和一个用于存储数据的变量。因此，我们使用了三个变量。

现在，如果您有一个具有许多节点的双向链表，它将使用太多的内存。为了使其更有效率，我们使用内存高效的双向链表。

内存高效的双向链表是一种链表，在其中我们仅使用一个指针来通过XOR和它的属性前后移动。

这里是一个图示：

如何前后移动？

您有一个临时变量（只有一个，不在节点中）。假设您从左到右遍历节点。所以你从节点A开始。在节点A的指针中，您存储节点B的地址。然后移动到节点B。在移动到节点B时，在临时变量中，您存储节点A的地址。

节点B的链接（指针）变量具有A ^ C的地址。您会将前一个节点的地址（即A）与当前链接字段进行XOR运算，从而获得C的地址。逻辑上看起来像：

A ^ (A ^ C)

现在让我们简化方程。由于关联律的存在，我们可以移除括号并进行重写：

A ^ A ^ C

我们可以进一步简化为。

0 ^ C

由于第二个属性（如表中所述的“None (2)”），因此发生了这种情况。

由于第一个属性（如表中所述的“None (1)”），因此基本上是这样的。

如果您无法理解所有内容，只需查看表格中列出的第三个属性（“None（3）”）。

现在，您已经获得了节点C的地址。回到起点的过程是一样的。

假设你从节点C到节点B。你会将节点C的地址存储在临时变量中，然后再次执行上面给出的过程。

注意：像A、B、C这样的所有东西都是地址。感谢Bathsheba告诉我要明确这一点。

XOR链表的缺点

正如Lundin所提到的，所有转换都必须从/to uintptr_t进行。
正如Sami Kuhmonen所提到的，你必须从一个明确定义的起点开始，而不仅仅是一个随机的节点。
你不能跳过一个节点。你必须按顺序前进。

还要注意，在大多数情况下，XOR链表并不比双向链表更好。

参考资料

- Box Box Box Box

6

好的，你可能已经看过了异或链表，它可以为每个项节省一个指针... 但是这是一种丑陋、难看的数据结构，并且远非最佳选择。

如果你担心内存问题，那么通常最好使用双向链表，每个节点包含多个元素，比如数组链表。

例如，虽然异或链表每个项需要1个指针和一个值，但是一个每个节点包含16个项的双向链表只需要每16个项3个指针，即每个项只需要3/16个指针。（额外的指针是记录节点中项数的整数的成本）。这比1还要小。

除了节省内存外，由于一个节点中所有16个项在内存中相邻，所以你还可以获得局部性优势。遍历列表的算法将更快。

请注意，异或链表还要求你在添加或删除节点时每次分配或释放内存，这是一项昂贵的操作。通过允许节点不完全满，你可以做得比这更好。例如，如果你允许5个空项插槽，那么你最多只需要每3次插入或删除一次分配或释放内存。

有许多可能的策略来确定何时和如何分配或释放节点。

- Matt Timmermans

2

您已经获得了关于XOR链表的详细解释，我将分享更多有关内存优化的想法。

1.在64位计算机上，指针通常占用8个字节。必须使用32位指针寻址超过4GB RAM范围内的任何点。

2.内存管理器通常处理固定大小的块，而不是字节。例如，C malloc通常以16字节为粒度进行分配。

这两件事意味着，如果您的数据只有1字节，则相应的双向链表元素将占用32字节（8 + 8 + 1，向最接近的16倍数四舍五入）。使用XOR技巧，可以将其降低到16字节。

但是，为了进一步优化，您可以考虑使用自己的内存管理器：

(a)以更低的粒度处理块，例如1字节甚至可能进入位级别，

(b)具有更严格的总大小限制。例如，如果您知道列表始终适合100MB连续块内，则只需要27位来寻址该块内的任何字节。不是32位或64位。

如果您不是开发通用列表类，而是了解应用程序的特定使用模式，在许多情况下，实现此类内存管理器可能很容易。例如，如果您知道永远不会分配超过1000个元素，并且每个元素需要5个字节，则可以将内存管理器实现为带有变量的5000字节数组，该变量保存第一个空闲字节的索引。当你分配额外的元素时，你只需获取该索引并通过分配的大小将其向前移动。在这种情况下，您的指针将不是真正的指针（如int *），而只是5000字节数组内部的索引。

- morfizm

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Box Box Box Box · Accepted Answer

我知道这是我的第二个答案, 但我认为我在这里提供的解释可能会更好一些，比上一个答案更好。但请注意，即使那个答案也是正确的。

内存高效链表经常被称为XOR链表，因为它完全依赖于XOR逻辑门及其属性。

它与双向链表有何不同？

是的，它不同。虽然它基本上执行了与双向链表几乎相同的工作，但它确实是不同的。

双向链表存储两个指针，分别指向前一个节点和后一个节点。基本上，如果要返回到上一个节点，可以通过back指针指向的地址进行；如果要向前移动，则可以通过next指针指向的地址进行。如下图所示：

内存高效链表，或者说是 XOR 链表，只有一个指针而不是两个。它存储先前地址（addr(prev)) XOR 下一个地址 (addr(next))。当您想要移动到下一个节点时，需要进行某些计算，以找到下一个节点的地址。这对于移动到上一个节点也是一样的。如下图所示：

它是如何工作的？

从名称中可以看出，XOR链表高度依赖于逻辑门XOR (^) 及其属性。

其属性为：

|-------------|------------|------------|
|    Name     |   Formula  |    Result  |
|-------------|------------|------------|
| Commutative |    A ^ B   |    B ^ A   |
|-------------|------------|------------|
| Associative | A ^ (B ^ C)| (A ^ B) ^ C|
|-------------|------------|------------|
| None (1)    |    A ^ 0   |     A      |
|-------------|------------|------------|
| None (2)    |    A ^ A   |     0      |
|-------------|------------|------------|
| None (3)    | (A ^ B) ^ A|     B      |
|-------------|------------|------------|

现在，让我们搁置这个问题，看看每个节点存储了什么：

第一个节点，或者说头节点，存储0^addr(next)，因为没有前一个节点或地址。它看起来像这样：

然后第二个节点存储addr(prev)^addr(next)。它看起来像这样:

上面的图片显示了B节点，也就是第二个节点。A和C是第三个和第一个节点的地址。除了头和尾节点以外的所有节点都是类似于上面的节点。

列表的尾巴没有任何下一个节点，因此它存储addr(prev)^0。它看起来像这样：

在了解如何移动之前，让我们再次看一下异或链接列表的表示：

当您看到

它很清楚地表示有一个链接字段，可以用它向前或向后移动。

还要注意，在使用异或链接列表时，您需要一个临时变量（不在节点中），它存储之前所在节点的地址。当您移动到下一个节点时，丢弃旧值，并存储之前所在节点的地址。

从头移动到下一个节点

假设现在您位于第一个节点A。现在您想要移动到节点B。这是这样做的公式：

Address of Next Node = Address of Previous Node ^ pointer in the current Node

那么这将是：

addr (next) = addr (prev) ^ (0 ^ addr (next))

由于这是头部，所以先前的地址将简单地为0，因此：

addr (next) = 0 ^ (0 ^ addr (next))

我们可以去掉括号：

addr (next) = 0 ^ 0 addr (next)

使用 none (2) 属性，我们可以说 0 ^ 0 将始终为 0：

addr (next) = 0 ^ addr (next)

使用none (1)属性，我们可以将其简化为：

addr (next) = addr (next)

你已经获得了下一个节点的地址！

从一个节点移动到下一个节点

现在假设我们在一个中间节点，该节点有前一个和后一个节点。

让我们应用公式：

Address of Next Node = Address of Previous Node ^ pointer in the current Node

现在替换数值：

addr (next) = addr (prev) ^ (addr (prev) ^ addr (next))

去除括号：

addr (next) = addr (prev) ^ addr (prev) ^ addr (next)

使用none (2)属性，我们可以简化：

addr (next) = 0 ^ addr (next)

使用none (1)属性，我们可以简化：

addr (next) = addr (next)

你已经得到它了！

从一个节点移动到之前所在的节点

如果你不理解标题，它基本上意味着如果你曾经在节点X，现在移动到节点Y，你想回到之前访问过的节点，或者基本上是节点X。

这并不是一项繁琐的任务。记住，我在上面提到过，你将你所在的地址存储在一个临时变量中。因此，你要访问的节点的地址就在一个变量中：

addr (prev) = temp_addr

从一个节点移动到前一个节点

这不同于上面提到的。我的意思是说，你在节点Z，现在你在节点Y，想要去节点X。

这与从一个节点移动到下一个节点几乎相同。只是相反的。当你编写程序时，你将使用我在从一个节点移动到下一个节点中提到的相同步骤，只是你要找到列表中比要找到下一个元素更早的元素。

我认为我不需要解释这个。

XOR链表的优点

它使用的内存比双向链表少。大约少33%。
它只使用一个指针。这简化了节点的结构。
正如doynax所说，XOR的子部分可以在常数时间内翻转。

XOR链表的缺点

它有一点棘手。有更高的失败几率，并且难以进行调试。
所有转换（在int的情况下）必须发生在/从uintptr_t中。
您不能仅获取节点的地址，并从那里开始遍历（或其他操作）。您必须始终从头或尾部开始。
~~你不能跳跃或跳过节点。你必须一个一个地走。~~
移动需要更多的操作。
使用XOR链表调试程序很困难。使用双向链表要容易得多。

C中的内存高效双向链表是什么？

它与双向链表有何不同？

它是如何工作的？

XOR链表的优点

XOR链表的缺点

参考文献

它是如何工作的