PaddlePaddle / Paddle
1 年多前同步成功

代码
- 文件
- 提交
- 分支
- Tags
- 贡献者
- 分支图
- Diff
Issue 1423
- 列表
- 看板
- 标记
- 里程碑
合并请求 543
Wiki 0
- Wiki
分析
- 仓库
- DevOps
项目成员
Pages

查找文件 Blame 历史永久链接 Permalink

Z

[Paddle-TRT] Fixes , opt for SoftmaxKernelWithEltadd kernel, test=develop (#24834) · 479c8834

由 zlsh80826 提交于 6月 17, 2020

* blockReduce opt

* launch threads align to warpSize

* reduce unnecessary shared memory for broadcast reduced value

* vectorize SoftmaxKernelWithEltadd

* add fp16 constrain

* test=develop

479c8834

math_cuda_utils.h 5.4 KB