标签列表
首页
标签
markov-decision-process
关联标签
reinforcement-learning
algorithm
artificial-intelligence
convergence
equation
expert-system
machine-learning
mdp
monte-carlo-tree-search
policy
q-learning
terminology
value-iteration
按时间
按得票
47
得票
3
回答
什么是强化学习中的策略?
我看到过这样的话: 在给定时间内,策略定义了学习代理的行为方式。粗略地说,策略是从环境感知状态到在那些状态下采取的行动的映射。 但仍然不完全理解,在强化学习中,策略到底是什么?
machine-learning
terminology
reinforcement-learning
markov-decision-process