Clojure中持久数据结构的内存共享

Question

Clojure中持久数据结构的内存共享

clojure

4

我开始学习Clojure，并阅读了关于结构共享的内容。在以下情况下，我感到困惑：按照以下顺序在REPL中键入以下Clojure代码：

1) (def a [1 2 3]), 2) (def b a), 3) (def a (conj a 4)), 4) (def b (conj b 5)),

第四步之后，a和b是否共享前三个元素的结构，还是所有值都将在第四步执行时被复制？如果结构是共享的，Clojure如何能够返回我们索引3处的值？

这与 Clojure中的结构共享有些相关，但我仍然感到困惑。任何形式的帮助都将不胜感激。

- abhishekmahawar

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Michał Marczyk · Accepted Answer

在问题文本中给出的示例中，根本没有发生任何结构共享。这是因为向量被实现为树形结构，其中实际元素存储在大小为32的叶节点中（最终叶子单独存储为向量的“尾巴”--性能优化），分支节点同样是32路的。因此，为了实现结构共享，需要一个足够大的向量：

;; a base vector:
(def v1 (vec (range 31)))

;; no structural sharing -- all elements are copied:
(def v2 (conj v1 31))

;; leftmost leaf of internal tree uses v2's tail as its internal array:
(def v3 (conj v2 32))

;; leftmost leaf shared with v3
(def v4 (conj v3 33))

一般来说，当将一个对象添加到现有向量时，新向量要么（1）与原始向量共享整个内部树但具有新尾部，要么（2）在原始内部树的每个级别上与原始向量共享除最右边的节点外的所有节点（并且可能比原始向量的内部树高一级）。（显然，原始向量的所有元素都与新向量共享。）

至于按索引查找值，每种情况都以相同的方式发生--向量不关心它们的结构是否与其他向量共享（鉴于它永远不会改变，没有理由需要这样做）。