1. 17 10月, 2022 1 次提交
    • G
      Support BF16 training for sharding (#46846) · 0b39b244
      Ghost Screaming 提交于
      * Fix bug of reduce_sum op. When input.numel() > INT32_MAX, its result
      is wrong.
      
      * support pure bfloat16
      
      * support bf16 linear
      
      * update PR to pass CI
      
      * tiny fix where_grad_kernel.cu
      
      * Support bfloat16 type for reducer and sharding.
      
      * Fix some bug.
      
      * Polish code.
      
      * Polise code.
      
      * Add bfloat16 datatype in fill_grad kernels.
      Co-authored-by: Nsneaxiy <sneaxiy@126.com>
      0b39b244
  2. 11 10月, 2022 2 次提交
  3. 10 10月, 2022 1 次提交
  4. 08 10月, 2022 1 次提交
  5. 30 9月, 2022 1 次提交
  6. 29 9月, 2022 1 次提交
  7. 21 9月, 2022 1 次提交
  8. 16 9月, 2022 1 次提交
  9. 07 9月, 2022 1 次提交
  10. 06 9月, 2022 1 次提交
  11. 01 9月, 2022 1 次提交
  12. 31 8月, 2022 1 次提交
  13. 26 8月, 2022 1 次提交
  14. 25 8月, 2022 1 次提交
  15. 22 8月, 2022 1 次提交
  16. 12 8月, 2022 1 次提交
  17. 08 8月, 2022 1 次提交
  18. 03 8月, 2022 1 次提交
  19. 01 8月, 2022 1 次提交
    • L
      unify gpu context (#44740) · 86763023
      Leo Chen 提交于
      * remove cudaDeviceContext
      
      * remove more template
      
      * fix rocm compile
      
      * remove alias name CUDADeviceContext
      
      * fix compile
      
      * fix tests
      
      * revert changes
      86763023
  20. 29 7月, 2022 2 次提交
  21. 28 7月, 2022 1 次提交
  22. 22 7月, 2022 1 次提交
  23. 11 7月, 2022 1 次提交
  24. 02 7月, 2022 1 次提交
    • L
      unify cpu context, part2 (#44012) · 755438a7
      Leo Chen 提交于
      * fix init()
      
      * delete test_device_context
      
      * replace CPUDeviceContext with CPUContext
      
      * fix test_scalar
      
      * remove dot_op.cc
      
      * fix compile
      755438a7
  25. 28 6月, 2022 2 次提交
  26. 26 6月, 2022 1 次提交
  27. 13 6月, 2022 1 次提交
  28. 07 6月, 2022 1 次提交
  29. 05 6月, 2022 1 次提交
  30. 04 6月, 2022 1 次提交
  31. 28 5月, 2022 1 次提交
  32. 18 5月, 2022 1 次提交
  33. 11 5月, 2022 1 次提交
  34. 06 5月, 2022 1 次提交
  35. 29 4月, 2022 1 次提交
  36. 26 4月, 2022 1 次提交
    • Z
      fix heter_client&heter_server (#42188) · 27cb52a4
      ziyoujiyi 提交于
      * back fl
      
      * delete ssl cert
      
      * .
      
      * make warning
      
      * .
      
      * unittest paral degree
      
      * solve unittest
      
      * heter & multi cloud commm ready
      
      * .
      
      * .
      
      * arm_brpc compile
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * only output is ok
      
      * base is ok
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * add switch server bin
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * adapt brpc ssl
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * .
      
      * fix heter_server & heter_client
      
      * .
      
      * .
      
      * int->int64_t
      
      * .
      27cb52a4
  37. 25 4月, 2022 1 次提交