- 23 8月, 2023 1 次提交
-
-
由 QingshuChen 提交于
-
- 10 8月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 08 8月, 2023 2 次提交
- 18 7月, 2023 1 次提交
-
-
由 XiaociZhang 提交于
In XCCL 1.0.53.6 there is a bugfix to fork scenario in RDMA, which was the root cause of dataloader segfault problem.
-
- 06 7月, 2023 1 次提交
-
-
由 XiaociZhang 提交于
This reverts commit 15c87528.
-
- 04 7月, 2023 1 次提交
-
-
由 hong19860320 提交于
* Add XPU plugin to support the customized ops or improve the performance of the fusion ops based on hand-written xpu micro kernels. * refine README.md
-
- 02 7月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 28 6月, 2023 2 次提交
-
-
由 XiaociZhang 提交于
* [XPU] fix compile issue for XPTI * bugfix * bugfix
-
由 QingshuChen 提交于
-
- 20 6月, 2023 1 次提交
-
-
由 XiaociZhang 提交于
* [kunlun] avoid compile issue in non-xpu env also rename macro WITH_XPU_XPTI to WITH_XPTI * move get_xpti_dependency.sh to tools/xpu * move get_xpti_dependency.sh to tools/xpu * call get_xpti_dependency.sh only in need
-
- 19 6月, 2023 1 次提交
-
-
由 AlbertVan 提交于
-
- 16 6月, 2023 1 次提交
-
-
由 jameszhang 提交于
* [kunlun] support xpu runtime profiler * fix cmake error * add libxpti.so to paddle package * fix for style check * sync change in setup.py and python/setup.py.in * remove libxpti.so from paddle output dir in this PR
-
- 06 6月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 30 5月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 23 5月, 2023 1 次提交
-
-
由 RuohengMa 提交于
-
- 22 5月, 2023 1 次提交
-
-
由 wangshengxiang 提交于
* bind xpu op: 3D grid sample * fix edge cases in xpu op: reshape & slice
-
- 12 5月, 2023 1 次提交
-
-
由 RuohengMa 提交于
-
- 11 5月, 2023 1 次提交
-
-
由 houj04 提交于
* [XPU] update dependency for xccl. * remove unnecessary codes.
-
- 28 4月, 2023 1 次提交
-
-
由 wangshengxiang 提交于
-
- 11 4月, 2023 1 次提交
-
-
由 ykkk2333 提交于
-
- 30 3月, 2023 1 次提交
-
-
由 ykkk2333 提交于
-
- 29 3月, 2023 1 次提交
-
-
由 jameszhang 提交于
* [kunlun] support min/max in dygraph mode * update xccl to 1.0.13
-
- 22 3月, 2023 1 次提交
-
-
由 risemeup1 提交于
* fix ninja error * fix_ninja_error * fix ninja error * fix r-200 ci ninja error
-
- 20 3月, 2023 1 次提交
-
-
由 mayang002 提交于
-
- 13 3月, 2023 1 次提交
-
-
由 houj04 提交于
* [XPU] add increment op. * fix ci
-
- 10 3月, 2023 1 次提交
-
-
由 zhangyikun02 提交于
-
- 06 3月, 2023 1 次提交
-
-
由 mayang002 提交于
-
- 28 2月, 2023 1 次提交
-
-
由 zhangyikun02 提交于
-
- 27 2月, 2023 1 次提交
-
-
由 jameszhang 提交于
* [kunlun] support reduce_scatter * uncomment unittest * update xccl to 1.0.10
-
- 22 2月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 20 2月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 16 2月, 2023 1 次提交
-
-
由 houj04 提交于
* [XPU] update xccl to 1.0.8 * update xdnn. add uint8 for concat and split. * update xdnn to 20230215.
-
- 31 1月, 2023 1 次提交
-
-
由 jameszhang 提交于
* [KUNLUN] rename test_pool_max_op.py * update xpu toolchain
-
- 29 1月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 20 1月, 2023 1 次提交
-
-
由 jameszhang 提交于
* update xccl lib & use native Reduce in dygraph * minor
-
- 18 1月, 2023 1 次提交
-
-
由 RuohengMa 提交于
* add reduce_sum_int64 and reduce_sum_int8 xpu kernels * [PHI] add clip grad kernel with support type float32 and int32 * [PHI unittest] add clip_grad unit test * adapt code to clang-format * update xpu api output with clip_grad api * remove int8 support of reduce_sum xpu kernel since it can not pass unit tests * adapt license date, add code for XPUDataType convertion * add int8 support of reduce_sum * add reduce_sum unit tests for dtype int64, int8, and add more test cases * update license date * remove buggy bitwise and, or and xor xpu kernels, refine bitwise not xpu kernel * change license date
-
- 15 1月, 2023 1 次提交
-
-
由 Roc 提交于
1 update xccl lib 2 when using comm_ctx, the allocator should be set manually.
-
- 11 1月, 2023 1 次提交
-
-
由 houj04 提交于
-
- 05 1月, 2023 1 次提交
-
-
由 Leo Guo 提交于
-