Created by: Colorfu1
在计算loss的时候,当我先做softmax,再做transpose,使用cross_entropy计算损失,得到loss=6.759191 调整顺序,先transpose,再做softmax,使用cross_entropy计算损失,得到loss=2.243314 在第一种的情况下,模型无法收敛。偶然发现是顺序造成的问题。