高效模拟滚动加权骰子（或遍历加权图），并进行频繁更新。

Question

高效模拟滚动加权骰子（或遍历加权图），并进行频繁更新。

6

我有一个加权有向图，大约有20,000个节点。

给定图中的一个节点，我会根据相对权重随机选择一个相邻节点。
每次选择后，我会收到有关选择是否好或坏的反馈，并更新网络。例如，在做出错误选择后，我会降低指向所选节点的所有边缘的权重。

我昨天了解到yesterday使用别名方法模拟掷骰子的方法，这与进行一次选择（每个节点都是一个加权骰子，每个面对应其他节点）相同。一次投掷非常高效，但更新权重则不然；由于我将更新的骰子数量多于投掷的骰子数量，因此可能不适用别名方法！ 我应该使用什么数据结构，可以允许频繁更新，并且哪种相应的算法最适合做出选择？

一些想法/笔记:

我可以通过记录每个权重调整来减少更新次数，然后仅在必要时（即直接在掷骰子之前）更新节点/骰子。但我仍然需要为每次投掷预先计算别名数据。
相反，我可以将图形存储为原样（以便更新廉价），并放弃别名方法。我将在每次掷骰子之前实时计算相对权重（这里使用二分查找）。
实时计算相对权重的另一个好处是，我可以将每个节点的“全局权重”因素分解出来，以进一步减少更新次数。然后，错误选择只会导致2次更新：传入边缘权重和节点的全局权重。
添加：也许有一种折中方案：维护数据结构中的本地相对权重（例如树或别名方法），然后在每次掷骰子时将它们与“全局权重”合并。

事实上，在实践中，我不需要经常做出选择（不超过一分钟一次），所以我不需要最有效的解决方案。但这是一个有趣的副业项目，我有兴趣找到一个理论上最优的解决方案。

- jmilloy

你正在对权重进行哪些更新？是重新计算所有权重，只更新一个权重，还是更新一半的权重等等？ - templatetypedef

@templatetypedef "例如，在做出错误选择后，我会降低指向所选节点的所有边的权重。此外，当使用别名方法（或具有预计算概率的二进制搜索）时，更改一个出边权重意味着需要重新计算所有别名信息（或概率）。" - jmilloy

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- ElKamina · Accepted Answer

我认为你可以用log(k)复杂度来完成，其中k是骰子面数。

对于一个特定的节点，让p1、p2、...、pk成为相对概率。让p1+p2,...,+pk=p。

使用这些相对概率作为叶子节点构建一棵树结构。每个非叶子节点的父节点是其子节点的相对概率之和。要“掷骰子”，请在0到p之间绘制随机值，并通过树跟随它。当您想要更新骰子面的相对概率时，只需更改相应的叶节点值并将其向上传播到整棵树。

通过这种方式，您可以使用一个随机数选择一个随机值，需要log(k)步骤才能找到与随机数对应的叶子节点，并且当您更新一个叶子节点时，需要log(k)时间来更新整棵树。

这是解决方案的非常简单的描述，请告诉我是否需要完整的描述。我确定它有效，但不确定它是否足够高效。

总结一下，这个算法需要： 1. 0到p之间的一个随机数 2. O(log(k)) 的复杂度来“掷骰子”（即找到下一个节点），其中k是骰子面数 3. 对于给定节点，“更新骰子”的复杂度为O(log(k))。如果原始节点有m条边，则复杂度为O(log(k1))+O(log(k2))...O((km))，其中k1、k2、... km是相邻节点的连通性。

====Tree Example====

如果骰子有4个面，相对概率为1:50、2:80、3:20、4:70，则构建如下树形结构：

          220
       /       \
    130         90
   /   \      /    \
 50    80    20    70
  |    |     |      |
  1    2     3      4

生成一个介于0和220之间的随机数v。如果v=100：选择左侧路径（因为100<130），然后选择右侧路径（因为100>80），并更新v = v-80 = 20。由于我们在叶子节点，声明输出即2

如果v=210：向左走，v=v-130=80，再向左走，v=v-70=10，返回叶子节点=4

如果4更改为60，则将70更改为60，90更改为80，220更改为210。

==== Lazy update variation ====

每当权重变化时，不要立即更新树。相反，只将其标记为“脏权重”，等到需要从该特定节点进行预测。

当您需要从特定节点进行预测并且某些权重是脏的时候，可以选择a.仅使用脏节点更新树或b.更新整个树。如果脏权重数量为t，总权重数为k，如果t * log（k）< k，则仅更新对应于脏权重的树（ t * O(k)）; 否则更新整棵树（O(k)）。