我的几个实验室同事一直在玩交叉熵强化学习。从他们那里和快速的互联网搜索中可以得到的所有信息来看,交叉熵方法似乎与遗传算法几乎相同。如果存在真正的区别,有人能向我解释这两种技术的区别吗?
我的几个实验室同事一直在玩交叉熵强化学习。从他们那里和快速的互联网搜索中可以得到的所有信息来看,交叉熵方法似乎与遗传算法几乎相同。如果存在真正的区别,有人能向我解释这两种技术的区别吗?
快速策略搜索的交叉熵方法(Mannor等人,2003年)
使用嘈杂的交叉熵方法学习俄罗斯方块(PDF) (Szita和Lörincz,2006年)
优化的交叉熵方法(Botev等人,2013年)