Created by: shuxsu
咨询一些问题 之前是单卡p4000训练 现在是4张2080ti 为什么同样的config 训练的速度并没有提升呢 batch_size只能设置为2 超过2就out of memory norm type:affine_channel 设置bn连2都会报out of memory 还有num_workers这个多线程只和cpu相关么 设置有什么建议或要求吗 时间并没有变快是什么原因呢?
有没有关于paddle的相关训练 调参建议呢