我有一个关于蒙特卡罗树搜索的小问题,可能有些愚蠢。我理解大部分内容,但看了一些实现后发现,在给定状态下运行MCTS并返回最佳移动后,树会被丢弃。因此,对于下一步,我们必须从头开始在这个新状态下运行MCTS以获取下一个最佳位置。
我只是想知道为什么我们不保留旧树中的一些信息。似乎旧树中有关状态的有价值信息,尤其是考虑到最佳移动是MCTS探索最多的移动之一。我们不能以某种有用的方式使用这些旧信息吗?
我只是想知道为什么我们不保留旧树中的一些信息。似乎旧树中有关状态的有价值信息,尤其是考虑到最佳移动是MCTS探索最多的移动之一。我们不能以某种有用的方式使用这些旧信息吗?