1. 17 11月, 2022 1 次提交
  2. 16 11月, 2022 1 次提交
  3. 14 11月, 2022 3 次提交
  4. 10 11月, 2022 2 次提交
    • J
      XPU multi-card support eager mode (#47445) · 3b91f8f3
      james 提交于
      * XPU support eager mode
      
      * add unittest for XPU eager mode
      
      * minor bugfix
      
      * minor bugfix, test=kunlun
      
      * correct copyright info
      
      * 1. remove unsed vars/funcs
      2. ProcessGroupBKCL inherit from ProcessGroupStream
      
      * bugfix for fp16 in eager mode multi-card, test=kunlun
      
      * rebase & fix a few issues
      
      * use new processgroup interface, test=kunlun
      
      * fix compile issue, test=kunlun
      3b91f8f3
    • W
      Refactor collective communication P2P C++ API (#47801) · d926c270
      Wen Sun 提交于
      * refactor: send, recv, send_partial, recv_partial
      
      * refactor: rm useless const ref
      d926c270
  5. 09 11月, 2022 1 次提交
  6. 08 11月, 2022 1 次提交
  7. 07 11月, 2022 1 次提交
  8. 04 11月, 2022 2 次提交
  9. 01 11月, 2022 1 次提交
  10. 31 10月, 2022 1 次提交
  11. 28 10月, 2022 2 次提交
  12. 17 10月, 2022 1 次提交
    • G
      Support BF16 training for sharding (#46846) · 0b39b244
      Ghost Screaming 提交于
      * Fix bug of reduce_sum op. When input.numel() > INT32_MAX, its result
      is wrong.
      
      * support pure bfloat16
      
      * support bf16 linear
      
      * update PR to pass CI
      
      * tiny fix where_grad_kernel.cu
      
      * Support bfloat16 type for reducer and sharding.
      
      * Fix some bug.
      
      * Polish code.
      
      * Polise code.
      
      * Add bfloat16 datatype in fill_grad kernels.
      Co-authored-by: Nsneaxiy <sneaxiy@126.com>
      0b39b244
  13. 11 10月, 2022 2 次提交
  14. 10 10月, 2022 1 次提交
  15. 08 10月, 2022 1 次提交
  16. 30 9月, 2022 1 次提交
  17. 29 9月, 2022 1 次提交
  18. 21 9月, 2022 1 次提交
  19. 16 9月, 2022 1 次提交
  20. 07 9月, 2022 1 次提交
  21. 06 9月, 2022 1 次提交
  22. 01 9月, 2022 1 次提交
  23. 31 8月, 2022 1 次提交
  24. 26 8月, 2022 1 次提交
  25. 25 8月, 2022 1 次提交
  26. 22 8月, 2022 1 次提交
  27. 12 8月, 2022 1 次提交
  28. 08 8月, 2022 1 次提交
  29. 03 8月, 2022 1 次提交
  30. 01 8月, 2022 1 次提交
    • L
      unify gpu context (#44740) · 86763023
      Leo Chen 提交于
      * remove cudaDeviceContext
      
      * remove more template
      
      * fix rocm compile
      
      * remove alias name CUDADeviceContext
      
      * fix compile
      
      * fix tests
      
      * revert changes
      86763023
  31. 29 7月, 2022 2 次提交
  32. 28 7月, 2022 1 次提交
  33. 22 7月, 2022 1 次提交