AssertionError: the action should be in range [-1.0, 1.0] 动作范围超限？ (#367) · Issue · PaddlePaddle / PARL

AssertionError: the action should be in range [-1.0, 1.0] 动作范围超限？

Created by: jkren6

在使用PARL官方提出的TD3算法训练时，偶尔会提示在action_mapping的时候，动作超出[-1.0, 1.0]范围的断言提示，然后就中断训练了。有的时候一开始训练就出现，有时训练几千的episode的时候才出现这个错误。

有同学说可能是PaddlePaddle版本的问题，建议我升级版本。请问是这样解决么，是否旧版本存在这个问题？

TD3 Repo: PARL/examples/TD3/