- 29 11月, 2022 1 次提交
-
-
由 JZ-LIANG 提交于
* get default calc stream from execution ctx instead of global dev ctx pool.
-
- 14 11月, 2022 1 次提交
-
-
由 Wen Sun 提交于
* refactor: simplify send, recv interfaces * refactor: rm send_partial, recv_partial, all_gather_partial
-
- 11 10月, 2022 1 次提交
-
-
由 Chen Weihang 提交于
* remove using lodtensor part1 * polish history code format
-
- 01 8月, 2022 1 次提交
-
-
由 Leo Chen 提交于
* remove cudaDeviceContext * remove more template * fix rocm compile * remove alias name CUDADeviceContext * fix compile * fix tests * revert changes
-
- 22 7月, 2022 1 次提交
-
-
由 Haohongxiang 提交于
-
- 26 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 03 12月, 2021 1 次提交
-
-
由 ronnywang 提交于
* refine structure for cuda and rocm * update * update * update * update
-
- 13 7月, 2021 1 次提交
-
-
由 WangXi 提交于
-
- 10 3月, 2021 1 次提交
-
-
由 lilong12 提交于
* remove the send/recv of tensor size, but users have to specify the shape of the received var explicitly.
-
- 24 2月, 2021 1 次提交
-
-
由 Qi Li 提交于
-
- 16 11月, 2020 1 次提交
-
-
由 lilong12 提交于
-
- 13 11月, 2020 1 次提交
-
-
由 lilong12 提交于
* update, test=develop
-