Created by: learner321
Hi,我们目前正在用paddle做一些测试,请问可以提供单卡收敛的参数设置参考吗?我们在测试的时候发现在中途30几个epoch的时候会出现梯度爆炸的情况,loss变大 我们需要测试如下网络:resnet50,数据集: imagenet,epoch=90,mixup=false,单卡
谢谢 :)