47得票3回答
什么是强化学习中的策略?

我看到过这样的话: 在给定时间内,策略定义了学习代理的行为方式。粗略地说,策略是从环境感知状态到在那些状态下采取的行动的映射。 但仍然不完全理解,在强化学习中,策略到底是什么?