- 28 2月, 2023 1 次提交
-
-
由 zhangyikun02 提交于
-
- 27 2月, 2023 1 次提交
-
-
由 jameszhang 提交于
* [kunlun] support reduce_scatter * uncomment unittest * update xccl to 1.0.10
-
- 22 2月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 20 2月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 16 2月, 2023 1 次提交
-
-
由 houj04 提交于
* [XPU] update xccl to 1.0.8 * update xdnn. add uint8 for concat and split. * update xdnn to 20230215.
-
- 31 1月, 2023 1 次提交
-
-
由 jameszhang 提交于
* [KUNLUN] rename test_pool_max_op.py * update xpu toolchain
-
- 29 1月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 20 1月, 2023 1 次提交
-
-
由 jameszhang 提交于
* update xccl lib & use native Reduce in dygraph * minor
-
- 18 1月, 2023 1 次提交
-
-
由 RuohengMa 提交于
* add reduce_sum_int64 and reduce_sum_int8 xpu kernels * [PHI] add clip grad kernel with support type float32 and int32 * [PHI unittest] add clip_grad unit test * adapt code to clang-format * update xpu api output with clip_grad api * remove int8 support of reduce_sum xpu kernel since it can not pass unit tests * adapt license date, add code for XPUDataType convertion * add int8 support of reduce_sum * add reduce_sum unit tests for dtype int64, int8, and add more test cases * update license date * remove buggy bitwise and, or and xor xpu kernels, refine bitwise not xpu kernel * change license date
-
- 15 1月, 2023 1 次提交
-
-
由 Roc 提交于
1 update xccl lib 2 when using comm_ctx, the allocator should be set manually.
-
- 11 1月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 05 1月, 2023 1 次提交
-
-
由 Leo Guo 提交于
-
- 29 12月, 2022 1 次提交
-
-
由 ykkk2333 提交于
-
- 19 12月, 2022 1 次提交
-
-
由 zhangyikun02 提交于
-
- 06 12月, 2022 1 次提交
-
-
由 ykkk2333 提交于
* add stat tool * add roll and roll_grad kernels and strided_slice and strided_slice_grad kernels, test=kunlun * add xpu rmsprop centered, test=kunlun
-
- 24 11月, 2022 1 次提交
-
-
由 zhangyikun02 提交于
-
- 23 11月, 2022 1 次提交
-
-
由 zhangyikun02 提交于
-
- 21 11月, 2022 1 次提交
-
-
由 houj04 提交于
-
- 17 11月, 2022 1 次提交
-
-
由 houj04 提交于
-
- 10 11月, 2022 1 次提交
-
-
由 zhangyikun02 提交于
-
- 04 11月, 2022 1 次提交
-
-
由 houj04 提交于
* [XPU] add cumsum op. test=kunlun * try to fix linker. test=kunlun * try to fix linker. test=kunlun * try to fix linker. test=kunlun * debug. test=kunlun * update xpu.cmake. remove unnecessary codes. test=kunlun.
-
- 18 10月, 2022 1 次提交
-
-
由 houj04 提交于
* [XPU] update xpu cmake to 1016. test=kunlun * fix special case of transpose op. test=kunlun
-
- 29 9月, 2022 1 次提交
-
-
由 houj04 提交于
* [XPU] update xpu cmake to 0923. test=kunlun * [XPU] update xpu cmake to 0928. test=kunlun
-
- 20 9月, 2022 2 次提交
- 07 9月, 2022 1 次提交
-
-
由 houj04 提交于
* [XPU] update xdnn to 0906. test=kunlun * [XPU] update xdnn to 0907. test=kunlun
-
- 01 9月, 2022 2 次提交
-
-
由 houj04 提交于
-
由 zhangyikun02 提交于
-
- 24 8月, 2022 1 次提交
-
-
由 zhangxiaoci 提交于
* update xccl lib * change user name to pass cla check
-
- 19 8月, 2022 1 次提交
-
-
由 houj04 提交于
-
- 15 8月, 2022 2 次提交
-
-
由 zhangyikun02 提交于
-
由 houj04 提交于
* [XPU] add some collective ops. test=kunlun * use XPUOpTestWrapper. test=kunlun * skip kl1 for collective ops. fix typo: deivce -> device. test=kunlun
-
- 10 8月, 2022 1 次提交
-
-
由 z8hanghuan 提交于
* fix bug of adaptive pool2d_grad, *test=kunlun * fix bug of adaptive pool2d_grad, *test=kunlun * fix bug of adaptive pool2d_grad, *test=kunlun
-
- 04 8月, 2022 1 次提交
-
-
由 dongfangshenzhu 提交于
* add merged_momentum *test=kunlun * add merged_momentum *test=kunlun * add fp16 to merged_momentum,*test=kunlun
-
- 02 8月, 2022 1 次提交
-
-
由 zhangyikun02 提交于
-
- 29 7月, 2022 1 次提交
-
-
由 houj04 提交于
-
- 28 7月, 2022 1 次提交
-
-
由 houj04 提交于
* [XPU] add top_k op. test=kunlun * [XPU] add top_k op. test=kunlun * use PADDLE_ENFORCE_XDNN_NOT_NULL to check pointer. test=kunlun
-
- 27 7月, 2022 1 次提交
-
-
由 z8hanghuan 提交于
* fix bug of elementwise_add_grad, *test=kunlun * fix bug, *test=kunlun * rm pooling_t, *test=kunlun * fix bug of ew_add_grad when inplace, *test=kunlun
-
- 22 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
*test=kunlun
-
- 18 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
* add xpu resnet_unit *test=kunlun * tmp *test=kunlun
-