- 22 6月, 2022 1 次提交
 - 
- 
由 Zhang Ting 提交于
[cherry pick] Support optional residual add in fused ops and slice large tensor for cudnn_softmax (#43719) [cherry pick] Support optional residual add in fused ops and slice large tensor for cudnn_softmax cherry-pick #43635 #43681 #43474
 
 - 
 - 16 3月, 2022 1 次提交
 - 
- 
由 Zhang Zheng 提交于
* Optimize the computation of log_softmax * modify the var name
 
 - 
 - 14 3月, 2022 1 次提交
 - 
- 
由 Zhang Zheng 提交于
* Optimize performance of log_softmax * delete unity build * modify to phi * fix * fixfixfixfix * fix * fix * fix * fix * simplify * fix * fix enforce
 
 - 
 - 11 3月, 2022 1 次提交
 - 
- 
由 Yiqun Liu 提交于
 
 - 
 - 02 3月, 2022 1 次提交
 - 
- 
由 zhangbo9674 提交于
* add softmax log_softmax * refine rocm * refine unittest
 
 - 
 - 25 2月, 2022 1 次提交
 - 
- 
由 Chen Weihang 提交于
* support cudnn kernel moving * polish cmake rules * add unittest for coverage * remove orig kernel * remove softmax cudnn kernel * fix softmax test failed * fix npu func error * resolve conflict * rename gpu dnn kernels * fix name rule error * fix compile error * update fp16 namespace
 
 - 
 - 11 2月, 2022 1 次提交
 - 
- 
由 Zhang Zheng 提交于
* Optimize performance of softmax_bwd when axis!=-1 * fix * fix * fix * fix
 
 - 
 - 09 2月, 2022 1 次提交
 - 
- 
由 Zhang Zheng 提交于
* Optimize performence of softmax_fwd when axis!=-1 * use functor * support hip * fix functor
 
 - 
 - 27 1月, 2022 1 次提交
 - 
- 
由 Feiyu Chan 提交于
 
 - 
 - 09 12月, 2021 1 次提交
 - 
- 
由 Feng Xing 提交于
 
 - 
 - 08 12月, 2021 1 次提交
 - 
- 
由 Yanxing Shi 提交于
 
 - 
 - 03 12月, 2021 1 次提交
 - 
- 
由 ronnywang 提交于
* refine structure for cuda and rocm * update * update * update * update
 
 - 
 - 28 10月, 2021 1 次提交
 - 
- 
由 Liu-xiandong 提交于
 
 - 
 - 08 9月, 2021 1 次提交
 - 
- 
由 Li Min 提交于
 
 - 
 - 14 4月, 2021 1 次提交
 - 
- 
由 xingfeng01 提交于
 
 - 
 - 03 3月, 2021 1 次提交
 - 
- 
由 Qi Li 提交于
 
 - 
 - 13 1月, 2021 1 次提交
 - 
- 
由 GaoWei8 提交于
* softmax backward optimize
 
 - 
 - 10 1月, 2021 1 次提交
 - 
- 
由 GaoWei8 提交于
* optimize softmax forward
 
 - 
 - 09 12月, 2020 1 次提交
 - 
- 
由 zlsh80826 提交于
* vec softmax fw * vec softmax bw * add a message argument for compiler compatibility
 
 -