PaddlePaddle / Paddle
大约 1 年前同步成功

代码
- 文件
- 提交
- 分支
- Tags
- 贡献者
- 分支图
- Diff
Issue 1423
- 列表
- 看板
- 标记
- 里程碑
合并请求 543
Wiki 0
- Wiki
分析
- 仓库
- DevOps
项目成员
Pages

Improve elementwise performance. !23001

Created by: zhaoyuchen2018

Elementwise performace is poor as walk into CommonGradBroadcastCUDA. add some new kernels for different data pattern.

elementwise	before opt(ms)	after opt(ms)
x=2048X100X1X32,y=1X128X32	156	46
x=2048X100X32,y=2048X100X1	11	0.48
x=2048X100X32,y=1X100X32	10	0.27
x=2048X100X32,y=2048X1X32	11	0.22

test case : https://github.com/PaddlePaddle/Paddle/pull/23209