- 22 6月, 2022 2 次提交
 - 
- 
由 wawltor 提交于
 - 
由 zhangkaihuo 提交于
 
 - 
 - 21 6月, 2022 6 次提交
 - 
- 
由 wangzhen38 提交于
* cpplint fix 3 * cpplint fix 3 * cpplint fix 3 * cpplint fix 3
 - 
由 zyfncg 提交于
 - 
由 Yao Zihang 提交于
 - 
由 Sing_chan 提交于
resort .cu headers, set clang-format not sort include block and consider .cu as main source file (#43633)
 - 
由 Zhang Ting 提交于
 - 
由 Sing_chan 提交于
 
 - 
 - 20 6月, 2022 2 次提交
 - 
- 
由 zhangbopd 提交于
 - 
由 zhouweiwei2014 提交于
* add new API/OP(csr->csr) of SparseTensor softmax * fix comment
 
 - 
 - 17 6月, 2022 2 次提交
 - 
- 
由 zhangkaihuo 提交于
* fix to_sparse_csr
 - 
由 Yiqun Liu 提交于
 
 - 
 - 16 6月, 2022 2 次提交
 - 
- 
由 ronnywang 提交于
* [CustomKernel] add custom kernel c api * update * update * fix unable to export capi Co-authored-by: Nronny1996 <524019753@qq.com> - 
由 Leo Chen 提交于
* fix xpu kp compilation * add depends
 
 - 
 - 15 6月, 2022 3 次提交
 - 
- 
由 Guoxia Wang 提交于
 - 
由 zhouweiwei2014 提交于
* add some kernel(csr*dense->csr, dense*dense->csr) of SparseTensor matmul * fix CI * fix CI * fix comment * fix comment
 - 
由 Yiqun Liu 提交于
Use int64_t in GetGpuLaunchConfig1D and ElementwiseKernel as index type to support large tensor. (#43506) * Change some data type from int to int64_t in GetGpuLaunchConfig1D to support large tensor. * Use int64_t in ElementwiseKernel as index type to support large tensor.
 
 - 
 - 14 6月, 2022 3 次提交
 - 
- 
由 Jiabin Yang 提交于
* fix starganv2 * fix starganv2 stop_gradient end error * fix edvr_starganv2 * fix mul kernel to fix optional ddx * fix typo
 - 
由 Zhang Jun 提交于
 - 
由 xiongkun 提交于
* change logic for optimize * modifty * optimize the backward speed of EinsumOp * add cache optimizer for einsum op * EinsumOp: fix new dygraph mode error * fix bug * change Cache->InnerCache * fix code * fix * add nan inf utils for einsum op * add as_extra * memory optimizer for einsum * update code
 
 - 
 - 13 6月, 2022 2 次提交
 - 
- 
由 zyfncg 提交于
* fix stride_slice bug * fix bug
 - 
由 zhangkaihuo 提交于
* use GpuMemcpy and GpuMemset * sparse convert kernel support double dispatch by indices dtype * cudaMemcpyKind->gpuMemcpyKind
 
 - 
 - 10 6月, 2022 4 次提交
 - 
- 
由 Chen Weihang 提交于
* fix depthwise conv yaml error * fix depthwise conv double grad error
 - 
由 Wilber 提交于
 - 
由 Leo Chen 提交于
* make all phi kernels to 2(host/device) static libraries directly * fix calling kernel_declare * fix compile * fix cpu compile * fix rocm compile * fix xpu compile * fix xpu kp compile * fix inference compile
 - 
由 tiancaishaonvjituizi 提交于
 
 - 
 - 09 6月, 2022 1 次提交
 - 
- 
由 crystal 提交于
Co-authored-by: NLiu Yiqun <liuyiqun01@baidu.com> 
 - 
 - 08 6月, 2022 1 次提交
 - 
- 
由 YuanRisheng 提交于
* move_group_norm * move group norm backward * fix code format * modify code according comment
 
 - 
 - 07 6月, 2022 6 次提交
 - 
- 
由 shixingbo 提交于
 - 
由 Leo Chen 提交于
 - 
由 Guoxia Wang 提交于
 - 
由 Wilber 提交于
 - 
由 limingshu 提交于
Transpose optimization with assitant of Chengdu Supercomputing Center and auto_tune operation (#42704)
 - 
由 niuliling123 提交于
 
 - 
 - 06 6月, 2022 1 次提交
 - 
- 
由 niuliling123 提交于
 
 - 
 - 05 6月, 2022 1 次提交
 - 
- 
由 Sing_chan 提交于
 
 - 
 - 04 6月, 2022 1 次提交
 - 
- 
由 Sing_chan 提交于
 
 - 
 - 02 6月, 2022 2 次提交
 - 
- 
由 Siming Dai 提交于
* support heter reindex * add unittest, fix bug * add comment * delete empty line * refine example * fix codestyle * add disable static
 - 
由 Li Min 提交于
* extend forward fast_ln_kernel to support more column values.
 
 - 
 - 01 6月, 2022 1 次提交
 - 
- 
由 YuanRisheng 提交于
* add yaml * fix infrt compile bugs
 
 -