三层CNN, cifar10数据集,用momentum不收敛,用adam准确率比tf低3%~4%
Created by: jzhang533
2.0-alpha 版本的飞桨。 对比结果如下面两张图:
BTW: mnist数据集,mlp网络用momentum可以收敛。
用来复现的notebook(可以在colab上,gpu运行) https://gist.github.com/jzhang533/df107c3a91d896874b6437caf2907be0
Created by: jzhang533
2.0-alpha 版本的飞桨。 对比结果如下面两张图:
BTW: mnist数据集,mlp网络用momentum可以收敛。
用来复现的notebook(可以在colab上,gpu运行) https://gist.github.com/jzhang533/df107c3a91d896874b6437caf2907be0