- 14 9月, 2022 2 次提交
-
-
由 sneaxiy 提交于
* fix distributed_fused_lamb nan * remove CUDA_ASSERT
-
由 Chenxiao Niu 提交于
-
- 06 9月, 2022 2 次提交
- 02 9月, 2022 2 次提交
-
-
由 ykkk2333 提交于
-
由 Aurelius84 提交于
* [XPU]Migrate Adam XPU kernel into Phi * test=kunlun
-
- 01 9月, 2022 2 次提交
-
-
由 taixiurong 提交于
test=kunlun
-
由 Aurelius84 提交于
* [XPU]Migrate adamw XPU kernel into Phi * test=kunlun * test=kunlun
-
- 31 8月, 2022 1 次提交
-
-
由 WangZhen 提交于
* Move XPU momentum to phi, test=kunlun * Fix mu type, test=kunlun
-
- 24 8月, 2022 1 次提交
-
-
由 mengqingchun02 提交于
* support beam_search operator on xpu. test=kunlun * support beam_search operator on xpu. test=kunlun * support beam_search operator on xpu. test=kunlun * support beam_search operator on xpu. test=kunlun * support beam_search operator on xpu. test=kunlun * support fp16 of adam operator in xpu environment. test=kunlun * support fp16 of adam operator in xpu environment. test=kunlun * support fp16 of adam operator in xpu environment. test=kunlun
-
- 19 8月, 2022 1 次提交
-
-
由 dongfangshenzhu 提交于
* add merged_momentum *test=kunlun * add merged_momentum *test=kunlun * add fp16 to merged_momentum,*test=kunlun * change dist_model.cc * add merged_momentum unittest and change momentum,test=kunlun * add merged_momentum unittest and change momentum,test=kunlun * add merged_momentum unittest and change momentum,test=kunlun * add merged_momentum unittest and change momentum,test=kunlun
-
- 17 8月, 2022 1 次提交
-
-
由 fwenguang 提交于
-
- 08 8月, 2022 1 次提交
-
-
由 Thomas Young 提交于
-
- 04 8月, 2022 2 次提交
-
-
由 dongfangshenzhu 提交于
* add merged_momentum *test=kunlun * add merged_momentum *test=kunlun * add fp16 to merged_momentum,*test=kunlun
-
由 sneaxiy 提交于
-
- 03 8月, 2022 1 次提交
-
-
由 sneaxiy 提交于
* add use_hierarchical_allreduce * support hierarchical allreduce for more cases
-
- 01 8月, 2022 1 次提交
-
-
由 Leo Chen 提交于
* remove cudaDeviceContext * remove more template * fix rocm compile * remove alias name CUDADeviceContext * fix compile * fix tests * revert changes
-
- 29 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
* add some fp16 op for kunlun resnet50 model *test=kunlun * tmp *test=kunlun
-
- 27 7月, 2022 1 次提交
-
-
由 Yuang Liu 提交于
-
- 25 7月, 2022 1 次提交
-
-
由 lyq 提交于
-
- 22 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
*test=kunlun
-
- 14 7月, 2022 2 次提交
- 13 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
* fix cpu lars_momentum bug & add xpu grad_add/log_softmax/log_softmax_grad *test=kunlun * minor *test=kunlun
-
- 12 7月, 2022 1 次提交
-
-
由 zhangbo9674 提交于
* remov merged_adam_op to phi * refine code
-
- 11 7月, 2022 1 次提交
-
-
由 houj04 提交于
* rmsprop for xpu. test=kunlun * minor fix (follow comments). test=kunlun
-
- 02 7月, 2022 1 次提交
-
-
由 Leo Chen 提交于
* fix init() * delete test_device_context * replace CPUDeviceContext with CPUContext * fix test_scalar * remove dot_op.cc * fix compile
-
- 26 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 13 6月, 2022 1 次提交
-
-
由 qipengh 提交于
-
- 10 6月, 2022 1 次提交
-
-
由 sneaxiy 提交于
-
- 09 6月, 2022 1 次提交
-
-
由 sneaxiy 提交于
* add nproc_per_node for DistributedFusedLamb * fix nproc_per_node communicator bug * fix ring_id = 1 init bug * fix ci * fix test_parallel_executor_mnist.py
-
- 07 6月, 2022 2 次提交
- 05 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 04 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 27 5月, 2022 1 次提交
-
-
由 zyfncg 提交于
* refactor the optional tensor * remove optiona<MetaTensor> in InferMeta * fix bug * fix optional<vector<Tensor>> * fix bug * fix rmsprop * fix amp of eager_gen * polish code * fix deleted code * fix merge conflict * polish code * remove is_nullopt_ * fix merge conflict * fix merge conflict
-
- 16 5月, 2022 1 次提交
-
-
由 wbn 提交于
* Add the new XDNN implementation. test=kunlun * Add the new XDNN implementation. test=kunlun * Modify the code based on review, test=kunlun
-
- 11 5月, 2022 1 次提交
-
-
由 taixiurong 提交于
-
- 10 5月, 2022 1 次提交
-
-
由 qipengh 提交于
-
- 29 4月, 2022 1 次提交
-
-
由 Aurelius84 提交于
-