我正在尝试使用这篇论文描述的方法https://arxiv.org/abs/1712.01815 来让算法学习一个新游戏。
唯一的问题是该方法并不能直接适用于我要学习的游戏,因为该游戏没有固定的棋盘大小。因此,当前输入张量的维度为m*n*11
,其中m和n是游戏棋盘的维度,每次玩游戏时都可以变化。因此,首先我需要一个神经网络能够利用这种可变的输入尺寸。
输出的大小也取决于棋盘大小,因为它有一个矢量,其中包含棋盘上每个可能的移动条目,所以如果棋盘大小增加,则输出向量将更大。
我已经了解了递归和循环神经网络,但它们似乎都与自然语言处理有关,我不确定如何将其应用到我的问题上。
欢迎提供任何能够处理我的情况的神经网络架构的想法。