Created by: hutuxian
单机单卡。 现象: 1、CPU训练(CPUPlace)出NaN,但是相同的参数下,使用GPU(CUDAPlace)就没问题。 2、定位到可能和batch_norm相关:去掉batch_norm,CPU也不会出NaN。 3、出现NaN的位置随机。