- 15 6月, 2022 2 次提交
-
-
由 Yiqun Liu 提交于
Use int64_t in GetGpuLaunchConfig1D and ElementwiseKernel as index type to support large tensor. (#43506) * Change some data type from int to int64_t in GetGpuLaunchConfig1D to support large tensor. * Use int64_t in ElementwiseKernel as index type to support large tensor.
-
由 Ruibiao Chen 提交于
* Refactor port.h * Remove some unnecessary code * Fix CI errors
-
- 14 6月, 2022 16 次提交
-
-
由 Jiabin Yang 提交于
* fix starganv2 * fix starganv2 stop_gradient end error * fix edvr_starganv2 * fix mul kernel to fix optional ddx * fix typo
-
由 Ruibiao Chen 提交于
* Support sequential run for standalone executor * Add UTs * Fix test_standalone_multiply_write * Remove unnecessary UTs
-
由 cambriconhsq 提交于
-
由 zhaoying9105 提交于
* [MLU]: add elementwise_max mlu kernel * [MLU]: add int32 support for elementwise maxk MLU kernel
-
由 zhaoying9105 提交于
-
由 tianshuo78520a 提交于
-
由 sneaxiy 提交于
-
由 Yuang Liu 提交于
-
由 Sing_chan 提交于
* open inference_ut;test=windows_ci_inference * inference_ut need onnx;test=windows_ci_inference * disable trt_split_converter_test; use higher parallel level * too high parallel will cause ut timeout
-
由 Zhang Jun 提交于
-
由 xiongkun 提交于
* change logic for optimize * modifty * optimize the backward speed of EinsumOp * add cache optimizer for einsum op * EinsumOp: fix new dygraph mode error * fix bug * change Cache->InnerCache * fix code * fix * add nan inf utils for einsum op * add as_extra * memory optimizer for einsum * update code
-
由 Sing_chan 提交于
-
由 Sing_chan 提交于
-
由 Wilber 提交于
* cmake-lint * update
-
由 zyfncg 提交于
-
由 Jiabin Yang 提交于
* fix custom op error * fix code error
-
- 13 6月, 2022 13 次提交
-
-
由 qipengh 提交于
-
由 Chenxiao Niu 提交于
-
由 chenjian 提交于
* add serialization for new field in event node * fix a bug
-
由 zhoutianzi666 提交于
-
由 津 提交于
-
由 piotrekobi 提交于
-
由 Tomasz Socha 提交于
* Enable bert model on CPU * Style
-
由 ShenLiang 提交于
-
由 zyfncg 提交于
* fix stride_slice bug * fix bug
-
由 Jiabin Yang 提交于
* support set_grad_ivar for eager * support set_grad_ivar for eager * support set_grad_ivar for eager
-
由 Ruibiao Chen 提交于
-
由 zhangkaihuo 提交于
-
由 zhangkaihuo 提交于
* use GpuMemcpy and GpuMemset * sparse convert kernel support double dispatch by indices dtype * cudaMemcpyKind->gpuMemcpyKind
-
- 12 6月, 2022 1 次提交
-
-
由 Leo Guo 提交于
Fix the bug of slice op and optimize the code style of generate_proposals_v2 op for kunlun. *test=kunlun (#43380)
-
- 11 6月, 2022 1 次提交
-
-
由 Chen Weihang 提交于
-
- 10 6月, 2022 7 次提交
-
-
由 Chen Weihang 提交于
* fix depthwise conv yaml error * fix depthwise conv double grad error
-
由 limingshu 提交于
-
由 光明和真理 提交于
-
由 fuyou765 提交于
-
由 Wilber 提交于
-
由 YuanRisheng 提交于
* change tensor name * fix unittest bugs
-
由 sneaxiy 提交于
-