[AssertionError]: the action should be in range [-1.0, 1.0] (#380) · Issue · PaddlePaddle / PARL

[AssertionError]: the action should be in range [-1.0, 1.0]

Created by: Ryan906k9

PPO 的 example 中，train.py 文件中，run_evaluate_episode 函数需要加上 action = np.clip(action, -1.0, 1.0)，否则有可能出现超过范围的情况导致程序运行失败。另外，建议可以在里面加上中间阶段进行模型保存的语句，否则整个训练过程很长，如果由于中间断掉要从头开始很可惜。