我想教一个人工神经网络玩 心脏扑克,但我卡在如何进行实际训练上了。
一个朋友建议使用 weka来实现实际的人工神经网络,但我从未使用过,所以我更倾向于自定义实现。
我已经编写了规则,并可以让计算机玩游戏,在每个回合随机选择合法的牌。
现在我不知道应该将什么发送到人工神经网络作为输入,以及如何提取输出(每回合减少的牌数,因此不能让每个输出神经元成为可能的牌),以及如何教它以及何时执行教学。
我的猜测是将以下内容作为人工神经网络的输入:
我也不太清楚应该什么时候教它(每轮之后还是每局之后),因为拥有所有罚牌很有益,但只缺一张罚牌就很糟糕。
非常感谢任何形式的帮助。我真的不知道在哪里提出这个问题。
我目前用Swift编程,但只有200行代码,我也会其他几种语言,所以我可以进行翻译。
一个朋友建议使用 weka来实现实际的人工神经网络,但我从未使用过,所以我更倾向于自定义实现。
我已经编写了规则,并可以让计算机玩游戏,在每个回合随机选择合法的牌。
现在我不知道应该将什么发送到人工神经网络作为输入,以及如何提取输出(每回合减少的牌数,因此不能让每个输出神经元成为可能的牌),以及如何教它以及何时执行教学。
我的猜测是将以下内容作为人工神经网络的输入:
- 已经播放的牌,带有哪个玩家播放了哪张牌的元数据
- 本轮桌面上的牌,也带有相同的元数据
- 人工神经网络手中的牌
我也不太清楚应该什么时候教它(每轮之后还是每局之后),因为拥有所有罚牌很有益,但只缺一张罚牌就很糟糕。
非常感谢任何形式的帮助。我真的不知道在哪里提出这个问题。
我目前用Swift编程,但只有200行代码,我也会其他几种语言,所以我可以进行翻译。