- 21 6月, 2022 2 次提交
-
-
由 Zhang Ting 提交于
-
由 Sing_chan 提交于
-
- 20 6月, 2022 2 次提交
-
-
由 zhangbopd 提交于
-
由 zhouweiwei2014 提交于
* add new API/OP(csr->csr) of SparseTensor softmax * fix comment
-
- 17 6月, 2022 2 次提交
-
-
由 zhangkaihuo 提交于
* fix to_sparse_csr
-
由 Yiqun Liu 提交于
-
- 16 6月, 2022 2 次提交
-
-
由 ronnywang 提交于
* [CustomKernel] add custom kernel c api * update * update * fix unable to export capi Co-authored-by: Nronny1996 <524019753@qq.com>
-
由 Leo Chen 提交于
* fix xpu kp compilation * add depends
-
- 15 6月, 2022 3 次提交
-
-
由 Guoxia Wang 提交于
-
由 zhouweiwei2014 提交于
* add some kernel(csr*dense->csr, dense*dense->csr) of SparseTensor matmul * fix CI * fix CI * fix comment * fix comment
-
由 Yiqun Liu 提交于
Use int64_t in GetGpuLaunchConfig1D and ElementwiseKernel as index type to support large tensor. (#43506) * Change some data type from int to int64_t in GetGpuLaunchConfig1D to support large tensor. * Use int64_t in ElementwiseKernel as index type to support large tensor.
-
- 14 6月, 2022 3 次提交
-
-
由 Jiabin Yang 提交于
* fix starganv2 * fix starganv2 stop_gradient end error * fix edvr_starganv2 * fix mul kernel to fix optional ddx * fix typo
-
由 Zhang Jun 提交于
-
由 xiongkun 提交于
* change logic for optimize * modifty * optimize the backward speed of EinsumOp * add cache optimizer for einsum op * EinsumOp: fix new dygraph mode error * fix bug * change Cache->InnerCache * fix code * fix * add nan inf utils for einsum op * add as_extra * memory optimizer for einsum * update code
-
- 13 6月, 2022 2 次提交
-
-
由 zyfncg 提交于
* fix stride_slice bug * fix bug
-
由 zhangkaihuo 提交于
* use GpuMemcpy and GpuMemset * sparse convert kernel support double dispatch by indices dtype * cudaMemcpyKind->gpuMemcpyKind
-
- 10 6月, 2022 4 次提交
-
-
由 Chen Weihang 提交于
* fix depthwise conv yaml error * fix depthwise conv double grad error
-
由 Wilber 提交于
-
由 Leo Chen 提交于
* make all phi kernels to 2(host/device) static libraries directly * fix calling kernel_declare * fix compile * fix cpu compile * fix rocm compile * fix xpu compile * fix xpu kp compile * fix inference compile
-
由 tiancaishaonvjituizi 提交于
-
- 09 6月, 2022 1 次提交
-
-
由 crystal 提交于
Co-authored-by: NLiu Yiqun <liuyiqun01@baidu.com>
-
- 08 6月, 2022 1 次提交
-
-
由 YuanRisheng 提交于
* move_group_norm * move group norm backward * fix code format * modify code according comment
-
- 07 6月, 2022 6 次提交
-
-
由 shixingbo 提交于
-
由 Leo Chen 提交于
-
由 Guoxia Wang 提交于
-
由 Wilber 提交于
-
由 limingshu 提交于
Transpose optimization with assitant of Chengdu Supercomputing Center and auto_tune operation (#42704)
-
由 niuliling123 提交于
-
- 06 6月, 2022 1 次提交
-
-
由 niuliling123 提交于
-
- 05 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 04 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 02 6月, 2022 2 次提交
-
-
由 Siming Dai 提交于
* support heter reindex * add unittest, fix bug * add comment * delete empty line * refine example * fix codestyle * add disable static
-
由 Li Min 提交于
* extend forward fast_ln_kernel to support more column values.
-
- 01 6月, 2022 3 次提交
-
-
由 YuanRisheng 提交于
* add yaml * fix infrt compile bugs
-
由 Aganlengzi 提交于
-
由 chentianyu03 提交于
* add conv3d yaml * add conv3d_grad, conv3d_double_grad * add final_state_conv3d test case * add conv3d double test case * add depthwise_conv2d grad yaml * add depthwise_conv2d double grad test case * modify the order of args * add depthwise_conv2d_grad_grad config
-
- 31 5月, 2022 3 次提交
-
-
由 Chen Weihang 提交于
* fix assign kernel copy impl * fix test failed
-
由 thunder95 提交于
* rrelu逻辑部分 * unregistered op kernel (unresolved) * commit before merge * 丰富测试用例 * 修复rrelu-sig的bug * 修复cpu环境测试 * 修改拼写错误 * 修改code format * 尝试优化测试用例timeout的问题 * 优化测试用例 * 移除seed, 优化随机函数 * update en doc for rrelu * fix rrelu en docs, test=document_fix * add paper link for en docs, test=document_fix * udpate en doc * add r,test=document_fix
-
由 xiongkun 提交于
* change einsum_v2 as default and add new flags: FLAG_einsum_opt=1|0 * make EInsumOP support bf16 * add unittest for BF16 * add condition for test_BF16 * fix bugs * fix
-
- 30 5月, 2022 1 次提交
-
-
由 crystal 提交于
-