1. 29 5月, 2020 1 次提交
  2. 28 5月, 2020 5 次提交
  3. 27 5月, 2020 2 次提交
  4. 25 5月, 2020 1 次提交
  5. 22 5月, 2020 2 次提交
  6. 21 5月, 2020 1 次提交
  7. 19 5月, 2020 7 次提交
  8. 15 5月, 2020 1 次提交
  9. 14 5月, 2020 1 次提交
  10. 13 5月, 2020 1 次提交
  11. 12 5月, 2020 1 次提交
  12. 07 5月, 2020 1 次提交
  13. 06 5月, 2020 2 次提交
  14. 05 5月, 2020 1 次提交
  15. 01 5月, 2020 2 次提交
  16. 29 4月, 2020 1 次提交
    • S
      CSR+FP32 fix (#206) · 6cb332f1
      Samyam Rajbhandari 提交于
      1) CSR parameter names should end with .weight. 
      2) When using basic optimizer directly, DeepSpeed should handle zero_grad. Letting the basic optimizer do the zero_grad resulted in residual gradients in the embedding layer due to unknown reasons.
      6cb332f1
  17. 28 4月, 2020 1 次提交
  18. 25 4月, 2020 2 次提交
  19. 23 4月, 2020 1 次提交
  20. 22 4月, 2020 1 次提交
  21. 21 4月, 2020 2 次提交
  22. 16 4月, 2020 1 次提交
  23. 12 4月, 2020 1 次提交
  24. 11 4月, 2020 1 次提交