关于在两块GPU下batch_size与max_iter的选择
Created by: ShuoWillWang
我这边正在使用COCO数据集从darknet53开始训练一个Paddle版本的yolov3。我在研究输入参数时发现batch_size默认为8,但是这是以8个GPU为基础的batch参数。我这里只有2个RTX-2080Ti显卡,如果想要达到网页上类似的测试效果,是否需要根据GPU调节batch_size或max_iter?另外,其他的参数是否也需要调节?谢谢
PS:我尝试将batch_size改为16,发现运行2-3分钟就有Out of Memory的问题。使用batch_size=8(其余的不改)训练到最后,发现与网页上宣称的map少了4个百分点。