无法恢复继续训练 (#16657) · Issue · PaddlePaddle / Paddle

无法恢复继续训练

Created by: AIFollowers

问题：基于develop分支编译的paddle，在单机多卡的情况下，无法恢复继续训练；模型：https://github.com/AIFollowers/models/fluid/PaddleCV/rcnn；启动脚本：python train_debug.py --model_save_dir=output/ --pretrained_model=output/model_final --data_dir=/home/ai/dataset/COCO17 --MASK_ON=False --max_iter=360000 --parallel=True --m_optim=True --save_var=False --save_grad=False | tee train.log 参考建议修改如下，但依然无法修复问题；

PaddlePaddle / Paddle 大约 2 年 前同步成功

无法恢复继续训练

PaddlePaddle / Paddle
大约 2 年前同步成功