1. 14 6月, 2018 1 次提交
    • Q
      Fix NCCLBcast hang up bug in Parallel Executor (#11377) · 046bb5c8
      Qiyang Min 提交于
      * 1. Create buddy allocator in each places before NcclBcast the variables
      2. Check the memory usage of ALL gpus rather than the first one
      
      * 1. Make NCCLGroupGuard guards only the ncclBcast part, which avoid ncclGroupEnd blocking the exception throwing
      2. NOTE the usage of NCCLGroupGuard
      
      * Remove the memory usage check of gpus
      
      * Fix code style
      046bb5c8
  2. 01 6月, 2018 1 次提交
  3. 14 5月, 2018 2 次提交
  4. 11 5月, 2018 1 次提交
  5. 07 5月, 2018 1 次提交
  6. 05 5月, 2018 1 次提交
  7. 04 5月, 2018 1 次提交
  8. 16 4月, 2018 1 次提交
  9. 11 4月, 2018 2 次提交
  10. 27 3月, 2018 2 次提交
  11. 21 3月, 2018 4 次提交
  12. 08 3月, 2018 1 次提交
  13. 07 3月, 2018 2 次提交
  14. 06 3月, 2018 2 次提交
  15. 15 2月, 2018 1 次提交
    • Y
      Update tensor_util.h (#8422) · cfffb1a3
      Yi Wang 提交于
      * Update tensor_util.h
      
      * Update with moved TensorDesc
      
      * Fix tensur_utils.cu
      
      * Update
      
      * Update
      
      * Update
      
      * Update
      
      * Make tensor_util.cu a symbolic link
      cfffb1a3
  16. 10 2月, 2018 2 次提交
  17. 07 2月, 2018 1 次提交
  18. 06 2月, 2018 2 次提交
  19. 01 2月, 2018 1 次提交
  20. 31 1月, 2018 1 次提交
  21. 30 1月, 2018 1 次提交