Created by: DDDivano
1、在训练阶段需要cocoapi 可以在readme中注明一下。
2、下载脚本./pretrained/download.sh会把模型下载到./pretrained目录下载,但是train.py会在 . 目录下寻找初始模型,会出现找不到问题,不会报错,但训练loss 为nan,需要修改一下download.sh的下载解压路径
3、训练过程会出现程序卡住,没有报错信息, gpu也占用,但是不输出log数据了。 目前已知大概率是驱动问题,384驱动会出问题,396不会。
4、训练过程中异常。见图。
