16得票3回答
使用可变动作的强化学习

我读过的所有强化学习算法通常都应用于一个具有固定行动数量的单个代理。是否有任何强化学习算法可以考虑变量数量的行动来做出决策?例如,在玩家控制N名士兵且每个士兵根据其状态具有随机数量的行动的计算机游戏中,如何应用强化学习算法?你无法为全局决策制定固定数量的行动(即“将军”),因为可用行动会随着士...

14得票5回答
搜索和规划有什么区别?

在人工智能领域,我现在正在阅读关于规划的内容。但是作为一名对AI不熟悉的人,我无法理解他们坚持“规划和搜索之间的区别”的要点。 我有类似于C / C ++的过程性编程知识,并且可以基于数据结构进行搜索。 而我也无法理解'Stuart Russell'在《人工智能:一种现代方法》中提供的Bu...

8得票1回答
前向规划启发式算法 - hmax、hadd、hff

我正在学习前向规划启发式算法hmax、hadd和hff,并在网上找到了一些资源,但我真的无法理解它们的实际工作原理。 以下是我目前找到的资源: http://icaps09.uom.gr/tutorials/tut1.pdf (由Emil Keyder和Blai Bonet于2009年举办...