PaddleSlim量化训练时总是出现Nan,请问是怎么回事?量化训练的学习率以及收敛问题
Created by: wonyoungsen
1、环境 Ubuntu16.04,1080ti,而且我在ai studio上训练也一样,总是出现nan,换了两台机器都是这个问题,学习率也设置了,0.001一直设置到好小,也出现nan, 2、顺便问一下,量化训练的学习率如何设置,也是从0.001开始吗? 3、还有,我训练好的baseline进行量化训练第一次迭代时的loss和进行常规训练时差不多都是4左右,然后从下一个迭代就会变到十几,而且以后一直在10左右徘徊,这种量化训练正常吗,浮动比较大,一般需要多久才能收敛到常规训练的水平?