- 03 8月, 2022 1 次提交
-
-
由 sneaxiy 提交于
* add use_hierarchical_allreduce * support hierarchical allreduce for more cases
-
- 01 8月, 2022 1 次提交
-
-
由 Leo Chen 提交于
* remove cudaDeviceContext * remove more template * fix rocm compile * remove alias name CUDADeviceContext * fix compile * fix tests * revert changes
-
- 29 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
* add some fp16 op for kunlun resnet50 model *test=kunlun * tmp *test=kunlun
-
- 27 7月, 2022 1 次提交
-
-
由 Yuang Liu 提交于
-
- 25 7月, 2022 1 次提交
-
-
由 lyq 提交于
-
- 22 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
*test=kunlun
-
- 14 7月, 2022 2 次提交
- 13 7月, 2022 1 次提交
-
-
由 QingshuChen 提交于
* fix cpu lars_momentum bug & add xpu grad_add/log_softmax/log_softmax_grad *test=kunlun * minor *test=kunlun
-
- 12 7月, 2022 1 次提交
-
-
由 zhangbo9674 提交于
* remov merged_adam_op to phi * refine code
-
- 11 7月, 2022 1 次提交
-
-
由 houj04 提交于
* rmsprop for xpu. test=kunlun * minor fix (follow comments). test=kunlun
-
- 02 7月, 2022 1 次提交
-
-
由 Leo Chen 提交于
* fix init() * delete test_device_context * replace CPUDeviceContext with CPUContext * fix test_scalar * remove dot_op.cc * fix compile
-
- 26 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 13 6月, 2022 1 次提交
-
-
由 qipengh 提交于
-
- 10 6月, 2022 1 次提交
-
-
由 sneaxiy 提交于
-
- 09 6月, 2022 1 次提交
-
-
由 sneaxiy 提交于
* add nproc_per_node for DistributedFusedLamb * fix nproc_per_node communicator bug * fix ring_id = 1 init bug * fix ci * fix test_parallel_executor_mnist.py
-
- 07 6月, 2022 2 次提交
- 05 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 04 6月, 2022 1 次提交
-
-
由 Sing_chan 提交于
-
- 27 5月, 2022 1 次提交
-
-
由 zyfncg 提交于
* refactor the optional tensor * remove optiona<MetaTensor> in InferMeta * fix bug * fix optional<vector<Tensor>> * fix bug * fix rmsprop * fix amp of eager_gen * polish code * fix deleted code * fix merge conflict * polish code * remove is_nullopt_ * fix merge conflict * fix merge conflict
-
- 16 5月, 2022 1 次提交
-
-
由 wbn 提交于
* Add the new XDNN implementation. test=kunlun * Add the new XDNN implementation. test=kunlun * Modify the code based on review, test=kunlun
-
- 11 5月, 2022 1 次提交
-
-
由 taixiurong 提交于
-
- 10 5月, 2022 1 次提交
-
-
由 qipengh 提交于
-
- 29 4月, 2022 1 次提交
-
-
由 Aurelius84 提交于
-
- 28 4月, 2022 1 次提交
-
-
由 sneaxiy 提交于
* add gradient merge for DistributedFusedLamb * use master acc gradient * fix CI ut * polish * remove math_function_impl.h change * fix test_update_loss_scaling_op.py * try to fix XPU/NPU CI * add gm ut
-
- 20 4月, 2022 1 次提交
-
-
由 fwenguang 提交于
-
- 15 4月, 2022 1 次提交
-
-
由 fwenguang 提交于
-
- 13 4月, 2022 1 次提交
-
-
由 zyfncg 提交于
* add sgd yaml * change python api * open eager mode in sgd * fix bug
-
- 07 4月, 2022 2 次提交
- 03 4月, 2022 1 次提交
-
-
由 hong 提交于
* add some infer meta * fix bug * fix bugs; * fix bug and add set data type * revert infer shape of lookup table * recover test
-
- 28 3月, 2022 1 次提交
-
-
由 hong 提交于
* move momentum, rmsprop to phi; test=develop * update * update * update * update * udpate; test=develop * fix xpu npu bugs; test=develop * fix npu bug; test=develop * fix windows compile error; test=develop * fix windows compile error; test=develop * polish code; test=develop * fix conflict; test=develop * add meshgrid; * update * polish code * polish code; * fix bug * format; remove useless code * fix npu bug * fix bug
-
- 25 3月, 2022 3 次提交
-
-
由 duanboqiang 提交于
* fix lars optitmizer bug * Update optimizer.py
-
由 Aurelius84 提交于
* [Phi] Migrate Adam and Adamw into Phi * fix compile error and unittest ok * fix compile error and unittest ok * fix undefined reference to fLI::FLAGS * test depend on operator * fix cmake * fix xpu compile * fix infrt * fix amp_type_traits * fix amp_type_traits * modify according reviewer * modify according reviewer * fix dtype float16 * fix typo * fix Cmake * fix code style
-
由 Aganlengzi 提交于
* [NPU] add merged_momentum * fix * fix device
-
- 14 3月, 2022 1 次提交
-
-
由 fwenguang 提交于
-
- 07 3月, 2022 2 次提交
-
-
由 Aurelius84 提交于
-
由 Aurelius84 提交于
* [Phi]Migrate Adamax into phi * Add adadelta kernel
-
- 04 3月, 2022 1 次提交
-
-
由 Leo Chen 提交于
* clean distribution_helper, index_impl, aligned_vector code in fluid * fix conflicts
-