“5e8ba7d7c043570e313eb02a37f0845f81d022b8”上不存在“develop/doc_cn/design/kernel_hint_design.html”
Created by: GaoWei8
PR types
Performance optimization
PR changes
OPs
Describe
增加softmax cudnn的 channel 模式,替换原有cudnn代码。
softmax前向
api | Paddle(kernel)优化前 | Paddle(kernel)优化后 | Tensorflow(kernel) | 参数 |
---|---|---|---|---|
softamx_5 | -- | 0.18842 | 0.60431 | input(Variable)-dtype:float32,shape:[128,128,16,16] axis(int):0 use_cudnn(bool):True |
softmax反向
api | Paddle(kernel)优化前 | Paddle(kernel)优化后 | Tensorflow(kernel) | 参数 |
---|---|---|---|---|
softamx_5 | -- | 0.3256 | 0.82062 | input(Variable)-dtype:float32,shape:[128,128,16,16] axis(int):0 use_cudnn(bool):True |