我的一个朋友正在开始构建一个NetHack机器人(一种玩Roguelike游戏:NetHack的机器人)。有一个非常好的类似游戏Angband的工作机器人,但它部分工作是因为方便回到城镇并始终能够通过低级别获得物品。
在NetHack中,问题要困难得多,因为游戏奖励大胆的实验,并基本上构建为1,000个边缘情况。
最近,我建议使用某种天真的贝叶斯分析,就像垃圾邮件创建的方式一样。
基本上,机器人首先会通过尝试找到的每个物品或生物的每个可能的动作来建立语料库,并将存储该信息,例如,接近死亡、受伤或负面影响的程度。随着时间的推移,您似乎可以生成一个相当可玩的模型。
有人能指点我们应该从何处入手吗?我是否误解了贝叶斯分析的概念?
编辑:我的朋友发布了他的NetHack补丁的Github repo,允许使用Python绑定。它仍处于相当原始的状态,但如果有人感兴趣...
在NetHack中,问题要困难得多,因为游戏奖励大胆的实验,并基本上构建为1,000个边缘情况。
最近,我建议使用某种天真的贝叶斯分析,就像垃圾邮件创建的方式一样。
基本上,机器人首先会通过尝试找到的每个物品或生物的每个可能的动作来建立语料库,并将存储该信息,例如,接近死亡、受伤或负面影响的程度。随着时间的推移,您似乎可以生成一个相当可玩的模型。
有人能指点我们应该从何处入手吗?我是否误解了贝叶斯分析的概念?
编辑:我的朋友发布了他的NetHack补丁的Github repo,允许使用Python绑定。它仍处于相当原始的状态,但如果有人感兴趣...