AssertionError: the action should be in range [-1.0, 1.0] 动作范围超限?
Created by: jkren6
在使用PARL官方提出的TD3算法训练时,偶尔会提示在action_mapping的时候,动作超出[-1.0, 1.0]范围的断言提示,然后就中断训练了。有的时候一开始训练就出现,有时训练几千的episode的时候才出现这个错误。
有同学说可能是PaddlePaddle版本的问题,建议我升级版本。请问是这样解决么,是否旧版本存在这个问题?
TD3 Repo: PARL/examples/TD3/