9得票2回答
观测意义-OpenAI Gym

我想了解在OpenAI Gym(https://gym.openai.com/)中观察CartPole-v0的规格说明。 例如,在以下代码输出中,observation如下:[-0.061586 -0.75893141 0.05793238 1.15547541],我想知道这些数字的...

9得票1回答
稳定的基线3运行时错误:mat1和mat2必须具有相同的数据类型。

我正在尝试在Stable Baselines3中使用自定义环境实现SAC算法,但是我一直遇到标题中的错误。这个错误不仅出现在SAC算法中,任何离线策略算法都会出现。 Traceback: File "<MY PROJECT PATH>\src\main.py", line 70...

9得票5回答
如何设置一个OpenAI Gym环境,以特定状态开始而非 `env.reset()`?

今天,我在尝试在openai-gym环境下实现一个rl-agent时,发现了一个问题,似乎所有的代理都是从最初的状态进行训练的:env.reset(),也就是说, import gym env = gym.make("CartPole-v0") initial_observation = ...

9得票3回答
OpenAI环境(gym)应该如何使用env.seed(0)?

我创建了一个非常简单的OpenAI gym (banana-gym),想知道/如何实现env.seed(0)。 请查看https://github.com/openai/gym/issues/250#issuecomment-234126816的示例。

8得票1回答
导入错误:无法从"gym.envs.classic_control"中导入"rendering"。

我正在使用强化学习智能体,并试图复制这个论文中的结果,其中他们基于Gym Open AI创建了一个自定义的Parkour环境,但是当尝试渲染此环境时我遇到了问题。 import numpy as np import time import gym import TeachMyAgent.en...

8得票3回答
OpenAI Gym - AttributeError: module 'contextlib' has no attribute 'nullcontext' OpenAI Gym - 属性错误:模块'contextlib'没有'nullcontext'属性

我在尝试从Google Compute Engine上的Docker容器中运行命令时遇到了此错误。 以下是堆栈跟踪: Traceback (most recent call last): File "train.py", line 16, in <module> f...

8得票1回答
OpenAI Gym Box空间配置

我需要一个从[0,无穷大)的观测空间。 我刚接触openai gym,不确定它应该是什么格式。 from gym spaces spaces.Box(np.array(0),np.array(np.inf)) # Box() spaces.Box(0, np.inf, shape = (...

8得票2回答
有没有一种方法可以在记录视频的同时禁用OpenAI gym中的视频渲染?

有没有办法在 OpenAI gym 中禁用视频渲染,但仍然记录它? 当我使用 Atari 环境和 Monitor 封装器时,默认行为是不渲染视频(视频仍会被记录并保存到磁盘上)。但是在简单的环境中,如 MountainCarContinuous-v0、CartPole-v0、Pendulum...

8得票2回答
Gym(openAI)环境的动作空间取决于实际状态。

我正在使用gym工具包创建自己的环境,并使用keras-rl将我的环境用于代理程序。问题在于我的动作空间会发生变化,它取决于实际状态。例如,我有46个可能的动作,但是在给定某个状态下,只有7个动作可用,而我无法找到一种建模方法。 我已经阅读了这个问题open-ai-enviroment-wi...

8得票2回答
RLlib使用自定义注册环境

Rllib文档提供了一些关于如何创建和训练自定义环境的信息。有关注册该环境的一些信息,但我猜它需要与gym registration不同的工作方式。 我正在测试使用SimpleCorridor环境进行工作。如果我将注册代码添加到文件中,如下所示: from ray.tune.registr...