1. 03 8月, 2022 1 次提交
  2. 01 8月, 2022 1 次提交
    • L
      unify gpu context (#44740) · 86763023
      Leo Chen 提交于
      * remove cudaDeviceContext
      
      * remove more template
      
      * fix rocm compile
      
      * remove alias name CUDADeviceContext
      
      * fix compile
      
      * fix tests
      
      * revert changes
      86763023
  3. 27 7月, 2022 1 次提交
  4. 26 6月, 2022 1 次提交
  5. 10 6月, 2022 1 次提交
  6. 09 6月, 2022 1 次提交
  7. 07 6月, 2022 1 次提交
  8. 05 6月, 2022 1 次提交
  9. 28 4月, 2022 1 次提交
  10. 07 4月, 2022 1 次提交
  11. 04 3月, 2022 1 次提交
  12. 02 3月, 2022 1 次提交
  13. 01 3月, 2022 1 次提交
  14. 25 2月, 2022 1 次提交
  15. 20 2月, 2022 1 次提交
  16. 19 2月, 2022 1 次提交
    • S
      Add the DistributedFusedLamb optimizer (#39148) · 5df3cd61
      sneaxiy 提交于
      * add DistributedFusedLamb op
      
      * polish code
      
      * fix compile error
      
      * compatible with pten changement
      
      * fix rocm compile error
      
      * improve converage
      
      * update upstream/develop
      
      * fix cast_with_ptr.h
      
      * add FLAGS_distributed_lamb_divide_nranks_when_allreduce=1
      
      * fix clip before allreduce
      
      * add use_master_param_norm
      
      * code polish
      
      * fix bug
      
      * fix ROCM ci
      5df3cd61