提交 · ba2e5de662f32a5fb6173d4901884768041a930c · BaiXuePrincess / Paddle

20 10月, 2017 1 次提交
- A
  
  Removing updates of Beta1 and Beta2 power accumulators outside the op (#4925) · 11bebeb2
  由 Abhinav Arora 提交于 10月 19, 2017
  
  11bebeb2
13 10月, 2017 1 次提交

Adding the Adam Optimizer operator (#4733) · 11680037

由 Abhinav Arora 提交于 10月 12, 2017

* add adam op

moment1_out = beta1 * moment1 + (1 − beta1) * grad
moment2_out = beta2 * moment2 + (1 − beta2) * grad * grad
moment1_hat =  moment1_out / (1 - beta1^t)
moment2_hat =  moment2_out / (1 - beta2^t)
param_out = param - learning_rate * moment1_hat / (sqrt(moment2_hat) +
epsilon)

* fix moment 2

* Adding the Adam optimization operator

* Adding more tests for Adam op

11680037

BaiXuePrincess / Paddle 与 Fork 源项目一致

BaiXuePrincess / Paddle
与 Fork 源项目一致