- 23 6月, 2022 1 次提交
-
-
由 Leo Chen 提交于
-
- 22 6月, 2022 2 次提交
-
-
由 wawltor 提交于
-
由 zhangkaihuo 提交于
-
- 21 6月, 2022 6 次提交
-
-
由 wangzhen38 提交于
* cpplint fix 3 * cpplint fix 3 * cpplint fix 3 * cpplint fix 3
-
由 zyfncg 提交于
-
由 Yao Zihang 提交于
-
由 Sing_chan 提交于
resort .cu headers, set clang-format not sort include block and consider .cu as main source file (#43633)
-
由 Zhang Ting 提交于
-
由 Sing_chan 提交于
-
- 20 6月, 2022 2 次提交
-
-
由 zhangbopd 提交于
-
由 zhouweiwei2014 提交于
* add new API/OP(csr->csr) of SparseTensor softmax * fix comment
-
- 17 6月, 2022 2 次提交
-
-
由 zhangkaihuo 提交于
* fix to_sparse_csr
-
由 Yiqun Liu 提交于
-
- 16 6月, 2022 2 次提交
-
-
由 ronnywang 提交于
* [CustomKernel] add custom kernel c api * update * update * fix unable to export capi Co-authored-by: Nronny1996 <524019753@qq.com>
-
由 Leo Chen 提交于
* fix xpu kp compilation * add depends
-
- 15 6月, 2022 3 次提交
-
-
由 Guoxia Wang 提交于
-
由 zhouweiwei2014 提交于
* add some kernel(csr*dense->csr, dense*dense->csr) of SparseTensor matmul * fix CI * fix CI * fix comment * fix comment
-
由 Yiqun Liu 提交于
Use int64_t in GetGpuLaunchConfig1D and ElementwiseKernel as index type to support large tensor. (#43506) * Change some data type from int to int64_t in GetGpuLaunchConfig1D to support large tensor. * Use int64_t in ElementwiseKernel as index type to support large tensor.
-
- 14 6月, 2022 3 次提交
-
-
由 Jiabin Yang 提交于
* fix starganv2 * fix starganv2 stop_gradient end error * fix edvr_starganv2 * fix mul kernel to fix optional ddx * fix typo
-
由 Zhang Jun 提交于
-
由 xiongkun 提交于
* change logic for optimize * modifty * optimize the backward speed of EinsumOp * add cache optimizer for einsum op * EinsumOp: fix new dygraph mode error * fix bug * change Cache->InnerCache * fix code * fix * add nan inf utils for einsum op * add as_extra * memory optimizer for einsum * update code
-
- 13 6月, 2022 2 次提交
-
-
由 zyfncg 提交于
* fix stride_slice bug * fix bug
-
由 zhangkaihuo 提交于
* use GpuMemcpy and GpuMemset * sparse convert kernel support double dispatch by indices dtype * cudaMemcpyKind->gpuMemcpyKind
-
- 10 6月, 2022 4 次提交
-
-
由 Chen Weihang 提交于
* fix depthwise conv yaml error * fix depthwise conv double grad error
-
由 Wilber 提交于
-
由 Leo Chen 提交于
* make all phi kernels to 2(host/device) static libraries directly * fix calling kernel_declare * fix compile * fix cpu compile * fix rocm compile * fix xpu compile * fix xpu kp compile * fix inference compile
-
由 tiancaishaonvjituizi 提交于
-
- 09 6月, 2022 1 次提交
-
-
由 crystal 提交于
Co-authored-by: NLiu Yiqun <liuyiqun01@baidu.com>
-
- 08 6月, 2022 1 次提交
-
-
由 YuanRisheng 提交于
* move_group_norm * move group norm backward * fix code format * modify code according comment
-
- 07 6月, 2022 6 次提交
-
-
由 shixingbo 提交于
-
由 Leo Chen 提交于
-
由 Guoxia Wang 提交于
-
由 Wilber 提交于
-
由 limingshu 提交于
Transpose optimization with assitant of Chengdu Supercomputing Center and auto_tune operation (#42704)
-
由 niuliling123 提交于
-
- 06 6月, 2022 1 次提交
-
-
由 niuliling123 提交于
-
- 05 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 04 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 02 6月, 2022 2 次提交
-
-
由 Siming Dai 提交于
* support heter reindex * add unittest, fix bug * add comment * delete empty line * refine example * fix codestyle * add disable static
-
由 Li Min 提交于
* extend forward fast_ln_kernel to support more column values.
-