1. 23 5月, 2023 1 次提交
    • H
      Functionalize distributed_fused_lamb kernel (#53896) · 5f8e7d8f
      huangjiyi 提交于
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update
      
      * update HostAlloc
      
      * update param name
      
      * update cpu kernel
      
      * remove kernel header
      
      * update
      
      * update
      5f8e7d8f
  2. 04 4月, 2023 1 次提交
  3. 24 3月, 2023 1 次提交
    • Y
      [PHI Decoupling]Remove memory header (Part3) (#51288) · 3d78e759
      YuanRisheng 提交于
      * decouple memory copy
      
      * fix ci bugs
      
      * fix ci compile bugs
      
      * fix rocm compile
      
      * fix ci bugs
      
      * decouple memory
      
      * deal with conflict
      
      * fix xpu compile bugs
      
      * fix xpu bugs
      
      * deal with xpu bugs
      
      * fix cmake bugs
      
      * fix windows bugs
      
      * fix ci bugs
      
      * fix ci bugs
      
      * delete redundance code
      
      * add code for pybind
      
      * fix py3 bugs
      
      * fix ci bugs
      3d78e759
  4. 01 3月, 2023 1 次提交
  5. 28 9月, 2022 1 次提交
    • C
      Remove the declaration of using Tensor in framework/tensor.h (#46432) · e12a905e
      Chen Weihang 提交于
      * remove needless using tensor
      
      * remove needless using tensor
      
      * resolve conflict
      
      * replace tensor using
      
      * fix format error
      
      * revert needless changing
      
      * fix rocm and npu compile error
      
      * fix cinn compile error
      
      * fix format error
      
      * fix mkldnn format error
      
      * fix mkldnn format error
      
      * fix cinn compile error
      
      * fix cinn compile error
      
      * fix cinn compile error
      
      * resolve conflict
      e12a905e
  6. 14 9月, 2022 1 次提交
  7. 08 8月, 2022 1 次提交
  8. 04 8月, 2022 1 次提交
  9. 03 8月, 2022 1 次提交
  10. 01 8月, 2022 1 次提交
    • L
      unify gpu context (#44740) · 86763023
      Leo Chen 提交于
      * remove cudaDeviceContext
      
      * remove more template
      
      * fix rocm compile
      
      * remove alias name CUDADeviceContext
      
      * fix compile
      
      * fix tests
      
      * revert changes
      86763023
  11. 27 7月, 2022 1 次提交
  12. 26 6月, 2022 1 次提交
  13. 10 6月, 2022 1 次提交
  14. 09 6月, 2022 1 次提交
  15. 07 6月, 2022 1 次提交
  16. 05 6月, 2022 1 次提交
  17. 28 4月, 2022 1 次提交
  18. 07 4月, 2022 1 次提交
  19. 04 3月, 2022 1 次提交
  20. 02 3月, 2022 1 次提交
  21. 01 3月, 2022 1 次提交
  22. 25 2月, 2022 1 次提交
  23. 20 2月, 2022 1 次提交
  24. 19 2月, 2022 1 次提交
    • S
      Add the DistributedFusedLamb optimizer (#39148) · 5df3cd61
      sneaxiy 提交于
      * add DistributedFusedLamb op
      
      * polish code
      
      * fix compile error
      
      * compatible with pten changement
      
      * fix rocm compile error
      
      * improve converage
      
      * update upstream/develop
      
      * fix cast_with_ptr.h
      
      * add FLAGS_distributed_lamb_divide_nranks_when_allreduce=1
      
      * fix clip before allreduce
      
      * add use_master_param_norm
      
      * code polish
      
      * fix bug
      
      * fix ROCM ci
      5df3cd61