Created by: lovelynight
训练过程中发现在验证集上的准确率为0,通过debug发现,网络输出的output重的preds这个,应该是一个【batchsize乘以max_text_length,1】的张量,但是在实际有一定可能出现【batchsize乘以max_text_length,char_num】的张量,这里的char_num是字典的大小,这个张量里面是概率,也就是说网络可能最后那一步topk的计算没有,同一个代码跑多次,有时正确有时错误,这是因为什么呢?