[AssertionError]: the action should be in range [-1.0, 1.0]
Created by: Ryan906k9
PPO 的 example 中,train.py 文件中,run_evaluate_episode 函数需要加上 action = np.clip(action, -1.0, 1.0),否则有可能出现超过范围的情况导致程序运行失败。
另外,建议可以在里面加上中间阶段进行模型保存的语句,否则整个训练过程很长,如果由于中间断掉要从头开始很可惜。