python/paddle/nn/functional/common.py · 07f68fadc2e866d06651b70aa5ceca4a5bd2f983 · Crayon鑫 / Paddle

[cherry pick] Some optimizations of elementwise_add, gelu and dropout for AMP (#30152) · 07f68fad

由 Leo Chen 提交于 1月 07, 2021

* Improve performance of elementwise_add grad op (#29187)

* pass stop_gradient for cast op

* improve performance of elementwise_add grad

* use tensor copy async

* dygraph branch

* fix dygraph branch

* add ut

* make gelu fp16 computing more robust (#29484)

* Add fast path for dropout when p == 0  (#29553)

* add fast path for p == 0 in dropout

* add ut

07f68fad

common.py 67.9 KB

Crayon鑫 / Paddle 与 Fork 源项目一致

Replace common.py

Crayon鑫 / Paddle
与 Fork 源项目一致