python/paddle/fluid/layers/nn.py · 07f68fadc2e866d06651b70aa5ceca4a5bd2f983 · PaddlePaddle / Paddle

[cherry pick] Some optimizations of elementwise_add, gelu and dropout for AMP (#30152) · 07f68fad

由 Leo Chen 提交于 1月 07, 2021

* Improve performance of elementwise_add grad op (#29187)

* pass stop_gradient for cast op

* improve performance of elementwise_add grad

* use tensor copy async

* dygraph branch

* fix dygraph branch

* add ut

* make gelu fp16 computing more robust (#29484)

* Add fast path for dropout when p == 0  (#29553)

* add fast path for p == 0 in dropout

* add ut

07f68fad

nn.py 586.5 KB

PaddlePaddle / Paddle 大约 1 年 前同步成功

Replace nn.py

PaddlePaddle / Paddle
大约 1 年前同步成功