- 07 12月, 2022 1 次提交
-
-
由 张春乔 提交于
-
- 28 11月, 2022 1 次提交
-
-
由 张春乔 提交于
-
- 18 11月, 2022 1 次提交
-
-
由 Wang Xin 提交于
* remove "gpu_primitives.h" in fluid namespace * fix PR-CI-GpuPS fail * fix PR-CI-GpuPS fail
-
- 31 10月, 2022 1 次提交
-
-
由 Wang Xin 提交于
-
- 26 10月, 2022 1 次提交
-
-
由 HongyuJia 提交于
-
- 25 10月, 2022 1 次提交
-
-
由 HongyuJia 提交于
* use dnn_fallback flag to delete mkldnn hardcode * polish code style * fix protected error * fix const error * fix reduce_op fallback * fix pool_op fallback * add Set function of dnn_fallback_
-
- 24 10月, 2022 1 次提交
-
-
由 Wang Xin 提交于
* fix macos inconsistent-missing-override warnings * fix inconsistent-missing-override error in test
-
- 17 10月, 2022 1 次提交
-
-
由 YuanRisheng 提交于
* namespace modify * update by comment
-
- 11 10月, 2022 2 次提交
-
-
由 Chenxiao Niu 提交于
-
由 Chen Weihang 提交于
* remove using lodtensor part1 * polish history code format
-
- 28 9月, 2022 1 次提交
-
-
由 Chen Weihang 提交于
* remove needless using tensor * remove needless using tensor * resolve conflict * replace tensor using * fix format error * revert needless changing * fix rocm and npu compile error * fix cinn compile error * fix format error * fix mkldnn format error * fix mkldnn format error * fix cinn compile error * fix cinn compile error * fix cinn compile error * resolve conflict
-
- 23 9月, 2022 1 次提交
-
-
由 YuanRisheng 提交于
-
- 22 9月, 2022 1 次提交
-
-
由 Piotr Paturej 提交于
* Convert slice+grad oneDNN fluid kernels to PHI * Change mutable_data to Alloc * Refactor licences
-
- 15 9月, 2022 1 次提交
-
-
由 Nyakku Shigure 提交于
-
- 14 9月, 2022 2 次提交
-
-
由 sneaxiy 提交于
* fix distributed_fused_lamb nan * remove CUDA_ASSERT
-
由 Chenxiao Niu 提交于
-
- 06 9月, 2022 2 次提交
- 02 9月, 2022 2 次提交
-
-
由 ykkk2333 提交于
-
由 Aurelius84 提交于
* [XPU]Migrate Adam XPU kernel into Phi * test=kunlun
-
- 01 9月, 2022 2 次提交
-
-
由 taixiurong 提交于
test=kunlun
-
由 Aurelius84 提交于
* [XPU]Migrate adamw XPU kernel into Phi * test=kunlun * test=kunlun
-
- 31 8月, 2022 1 次提交
-
-
由 WangZhen 提交于
* Move XPU momentum to phi, test=kunlun * Fix mu type, test=kunlun
-
- 24 8月, 2022 1 次提交
-
-
由 mengqingchun02 提交于
* support beam_search operator on xpu. test=kunlun * support beam_search operator on xpu. test=kunlun * support beam_search operator on xpu. test=kunlun * support beam_search operator on xpu. test=kunlun * support beam_search operator on xpu. test=kunlun * support fp16 of adam operator in xpu environment. test=kunlun * support fp16 of adam operator in xpu environment. test=kunlun * support fp16 of adam operator in xpu environment. test=kunlun
-
- 19 8月, 2022 1 次提交
-
-
由 dongfangshenzhu 提交于
* add merged_momentum *test=kunlun * add merged_momentum *test=kunlun * add fp16 to merged_momentum,*test=kunlun * change dist_model.cc * add merged_momentum unittest and change momentum,test=kunlun * add merged_momentum unittest and change momentum,test=kunlun * add merged_momentum unittest and change momentum,test=kunlun * add merged_momentum unittest and change momentum,test=kunlun
-
- 17 8月, 2022 1 次提交
-
-
由 fwenguang 提交于
-
- 08 8月, 2022 1 次提交
-
-
由 Thomas Young 提交于
-
- 04 8月, 2022 2 次提交
-
-
由 dongfangshenzhu 提交于
* add merged_momentum *test=kunlun * add merged_momentum *test=kunlun * add fp16 to merged_momentum,*test=kunlun
-
由 sneaxiy 提交于
-
- 03 8月, 2022 1 次提交
-
-
由 sneaxiy 提交于
* add use_hierarchical_allreduce * support hierarchical allreduce for more cases
-
- 01 8月, 2022 1 次提交
-
-
由 Leo Chen 提交于
* remove cudaDeviceContext * remove more template * fix rocm compile * remove alias name CUDADeviceContext * fix compile * fix tests * revert changes
-
- 29 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
* add some fp16 op for kunlun resnet50 model *test=kunlun * tmp *test=kunlun
-
- 27 7月, 2022 1 次提交
-
-
由 Yuang Liu 提交于
-
- 25 7月, 2022 1 次提交
-
-
由 lyq 提交于
-
- 22 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
*test=kunlun
-
- 14 7月, 2022 2 次提交
- 13 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
* fix cpu lars_momentum bug & add xpu grad_add/log_softmax/log_softmax_grad *test=kunlun * minor *test=kunlun
-
- 12 7月, 2022 1 次提交
-
-
由 zhangbo9674 提交于
* remov merged_adam_op to phi * refine code
-
- 11 7月, 2022 1 次提交
-
-
由 houj04 提交于
* rmsprop for xpu. test=kunlun * minor fix (follow comments). test=kunlun
-