不同版本paddle下seqToseq运行结果差异问题
Created by: shiningboy123
我在跑seqToseq时,0.9.0版本simple_gru和simple_gru_layer没有naive参数,也没设置error_clipping,cost和classification_error下降的比较可以,到第四个pass的时候,classification_error就降到0.4几了, 但是在0.10.0下跑,没设置naive和error_clipping时会出现NaN,而设置后,error_clipping用demo里默认的50,跑完15个pass,classification_error至少还有0.6,0.7,这是怎么回事?