我尝试按照这份文档的建议设置"export OPENBLAS_NUM_THREADS=1"。但是我发现一个奇怪的现象,即这样设置会显著损害我的RL算法的性能(我对TD3和SAC进行了一些测试,所有结果都一致表明"export OPENBLAS_NUM_THREADS=1"会影响性能)。为什么会引起这样大的问题呢?
顺便说一下,算法是使用Tensorflow1.13实现的,数据是通过tf.data.Dataset输入到神经网络中的。所有测试都在OpenAI的Gym中的BipedalWalker-v2环境上进行。
顺便说一下,算法是使用Tensorflow1.13实现的,数据是通过tf.data.Dataset输入到神经网络中的。所有测试都在OpenAI的Gym中的BipedalWalker-v2环境上进行。
OPENBLAS_NUM_THREADS=1
了?顺便说一下,我不太确定我们是否同意对“性能”的定义。当我设置OPENBLAS_NUM_THREADS=1
时,收敛后的100个回合的平均得分在250-300之间变化。而如果我不设置这个参数,平均得分就会稳定在300左右。我不明白为什么简单地设置OPENBLAS_NUM_THREADS=1
会有这样的差异。 - Mayberay
来实现我的算法的分布式版本。根据文档,我进行了设置。然后我发现了这个令人困惑的现象。 - Maybe