无法恢复继续训练
Created by: AIFollowers
问题:基于develop分支编译的paddle,在单机多卡的情况下,无法恢复继续训练; 模型:https://github.com/AIFollowers/models/fluid/PaddleCV/rcnn; 启动脚本:python train_debug.py --model_save_dir=output/ --pretrained_model=output/model_final --data_dir=/home/ai/dataset/COCO17 --MASK_ON=False --max_iter=360000 --parallel=True --m_optim=True --save_var=False --save_grad=False | tee train.log 参考建议修改如下,但依然无法修复问题;