24得票1回答
蒙特卡罗树搜索代理在孤立游戏中的调试建议

简述 MCTS智能体实现在本地运行无误,在与启发式驱动的minimax对战中获得了超过40%的胜率,但未通过自动评分器测试——这是提交项目之前的要求。自动评分器抛出了IndexError: Cannot choose from an empty sequence错误。我正在寻找代码中最有可...

10得票1回答
蒙特卡罗树搜索在实践中如何实现

我在一定程度上理解算法的工作原理。我并不完全了解算法在实践中是如何实际实施的。 我有兴趣了解对于比较复杂的游戏(例如国际象棋),最优化的方法是什么,比如:递归方法?异步?并发?并行?分布式?数据结构和/或数据库? - 我们期望在单台机器上看到哪些限制?(我们可以同时在许多核心上运行...也...

8得票2回答
蒙特卡罗树搜索算法中的置换表对UCT分数的意外影响

因此,我在使用UCT的蒙特卡罗树搜索算法中实现了一个置换表。这可以使游戏状态的累积奖励值保持不变,无论它在树中的哪个位置以及遇到多少次。这提高了对特定游戏状态收集信息的质量。 然而,我注意到这会在UCT的开发与探索选择阶段中造成一些问题。简而言之,分配给状态的UCT分数考虑了父状态被访问的次...