14得票2回答
类型错误:符号张量的长度未定义。(activation_3/Identity:0) 请调用 `x.shape` 而不是 `len(x)` 获取形状信息。

我正在尝试在OpenAI gym的一个游戏上实现DQL模型。但是它给了我以下错误。 TypeError: 对于符号张量,len未定义。 (activation_3/Identity:0) 请调用 x.shape 而不是 len(x) 获取形状信息。 创建gym环境:ENV_...

13得票1回答
为什么我的DQN智能体无法在非确定性环境中找到最优策略?

编辑:以下内容似乎也适用于FrozenLake-v0。请注意,我对简单的Q-learning不感兴趣,因为我想看到适用于连续观测空间的解决方案。 最近我创建了banana_gym OpenAI环境。情景如下: 你有一根香蕉。它必须在两天内出售,因为第三天会变坏。你可以选择价格x,但香蕉只有...

12得票1回答
如何在keras-rl / OpenAI GYM中实现自定义环境?

我是一个完全的强化学习新手,一直在寻找一个框架/模块来轻松地探索这个危险的领域。在我的搜索中,我发现了两个模块keras-rl和OpenAI GYM。 我可以让它们在它们在WIKI上分享的示例上工作,但它们都带有预定义的环境,并且几乎没有关于如何设置自己的自定义环境的信息。 如果有人能指点...

8得票2回答
Gym(openAI)环境的动作空间取决于实际状态。

我正在使用gym工具包创建自己的环境,并使用keras-rl将我的环境用于代理程序。问题在于我的动作空间会发生变化,它取决于实际状态。例如,我有46个可能的动作,但是在给定某个状态下,只有7个动作可用,而我无法找到一种建模方法。 我已经阅读了这个问题open-ai-enviroment-wi...