1. 18 11月, 2022 1 次提交
    • J
      fix device id issue for xpu eager mode (#48076) · 3b18d96b
      james 提交于
      * fix device id issue for xpu eager
      
      xpu device id is not correctly set in eager mode, thus vars are on dev0 unless
      XPUDeviceGurad is called, leading to this error message for all node rank != 0:
      "NotImplementedError: (Unimplemented) Place Place(xpu:0) is not supported."
      
      * fix typo
      
      * fix pybind error
      3b18d96b
  2. 17 11月, 2022 1 次提交
  3. 14 11月, 2022 3 次提交
  4. 10 11月, 2022 2 次提交
    • J
      XPU multi-card support eager mode (#47445) · 3b91f8f3
      james 提交于
      * XPU support eager mode
      
      * add unittest for XPU eager mode
      
      * minor bugfix
      
      * minor bugfix, test=kunlun
      
      * correct copyright info
      
      * 1. remove unsed vars/funcs
      2. ProcessGroupBKCL inherit from ProcessGroupStream
      
      * bugfix for fp16 in eager mode multi-card, test=kunlun
      
      * rebase & fix a few issues
      
      * use new processgroup interface, test=kunlun
      
      * fix compile issue, test=kunlun
      3b91f8f3
    • W
      Refactor collective communication P2P C++ API (#47801) · d926c270
      Wen Sun 提交于
      * refactor: send, recv, send_partial, recv_partial
      
      * refactor: rm useless const ref
      d926c270
  5. 09 11月, 2022 1 次提交
  6. 08 11月, 2022 2 次提交
  7. 07 11月, 2022 1 次提交
  8. 28 10月, 2022 2 次提交
  9. 11 10月, 2022 1 次提交
  10. 08 10月, 2022 1 次提交
  11. 30 9月, 2022 1 次提交
  12. 21 9月, 2022 1 次提交
  13. 16 9月, 2022 1 次提交
  14. 31 8月, 2022 1 次提交
  15. 03 8月, 2022 1 次提交
  16. 22 7月, 2022 1 次提交
  17. 11 7月, 2022 1 次提交
  18. 22 6月, 2022 1 次提交
  19. 05 6月, 2022 1 次提交
  20. 06 5月, 2022 1 次提交
  21. 18 4月, 2022 1 次提交
  22. 13 4月, 2022 1 次提交
  23. 07 4月, 2022 1 次提交
  24. 31 3月, 2022 1 次提交
  25. 18 3月, 2022 1 次提交
  26. 15 3月, 2022 1 次提交
  27. 08 3月, 2022 1 次提交
  28. 07 3月, 2022 1 次提交
  29. 03 3月, 2022 2 次提交
  30. 02 3月, 2022 1 次提交
  31. 01 3月, 2022 1 次提交
  32. 23 2月, 2022 1 次提交