Created by: GaoWei8
PR types
Performance optimization
PR changes
OPs
Describe
增加softmax cudnn的 channel 模式,替换原有cudnn代码。
softmax前向
api | Paddle(kernel)优化前 | Paddle(kernel)优化后 | Tensorflow(kernel) | 参数 |
---|---|---|---|---|
softamx_5 | -- | 0.18842 | 0.60431 | input(Variable)-dtype:float32,shape:[128,128,16,16] axis(int):0 use_cudnn(bool):True |
softmax反向
api | Paddle(kernel)优化前 | Paddle(kernel)优化后 | Tensorflow(kernel) | 参数 |
---|---|---|---|---|
softamx_5 | -- | 0.3256 | 0.82062 | input(Variable)-dtype:float32,shape:[128,128,16,16] axis(int):0 use_cudnn(bool):True |