1. 14 6月, 2018 1 次提交
    • Q
      Fix NCCLBcast hang up bug in Parallel Executor (#11377) · 046bb5c8
      Qiyang Min 提交于
      * 1. Create buddy allocator in each places before NcclBcast the variables
      2. Check the memory usage of ALL gpus rather than the first one
      
      * 1. Make NCCLGroupGuard guards only the ncclBcast part, which avoid ncclGroupEnd blocking the exception throwing
      2. NOTE the usage of NCCLGroupGuard
      
      * Remove the memory usage check of gpus
      
      * Fix code style
      046bb5c8
  2. 12 6月, 2018 1 次提交
  3. 11 6月, 2018 1 次提交
  4. 10 6月, 2018 2 次提交
  5. 08 6月, 2018 1 次提交
  6. 07 6月, 2018 1 次提交
  7. 06 6月, 2018 3 次提交
  8. 01 6月, 2018 1 次提交
  9. 14 5月, 2018 2 次提交
  10. 11 5月, 2018 2 次提交
  11. 04 5月, 2018 1 次提交
  12. 02 5月, 2018 2 次提交
  13. 26 4月, 2018 1 次提交
  14. 24 4月, 2018 1 次提交
  15. 23 4月, 2018 1 次提交
  16. 18 4月, 2018 1 次提交
  17. 17 4月, 2018 5 次提交
  18. 12 4月, 2018 1 次提交
  19. 10 4月, 2018 2 次提交
  20. 09 4月, 2018 2 次提交
  21. 04 4月, 2018 1 次提交
  22. 03 4月, 2018 2 次提交
  23. 02 4月, 2018 2 次提交
  24. 30 3月, 2018 1 次提交
  25. 26 3月, 2018 2 次提交