1. 21 9月, 2022 1 次提交
  2. 18 9月, 2022 1 次提交
  3. 15 9月, 2022 1 次提交
  4. 09 9月, 2022 2 次提交
  5. 08 9月, 2022 2 次提交
  6. 07 9月, 2022 1 次提交
  7. 01 9月, 2022 1 次提交
  8. 31 8月, 2022 1 次提交
  9. 23 8月, 2022 1 次提交
  10. 17 8月, 2022 1 次提交
  11. 16 8月, 2022 1 次提交
    • F
      convert multihead to oss (#45019) · f706d95d
      feng_shuai 提交于
      * convert multihead to oss
      
      * fix:bug
      
      * fix:delete const cast
      
      * fix:don't support bias_qk
      
      * add vit pass
      
      * fix:convert bug and add preln_residual_bias
      
      * support length=-1
      
      * add UT for convert
      
      * add no_bias_qk support for gpu_multihead_op
      
      * delete infer_shape depends on bias_qk
      
      * oss just can be used in T4 and A*
      
      * fix:change api for ROCM CI
      f706d95d
  12. 15 8月, 2022 2 次提交
  13. 09 8月, 2022 1 次提交
  14. 05 8月, 2022 1 次提交
  15. 02 8月, 2022 1 次提交
  16. 01 8月, 2022 1 次提交
    • L
      unify gpu context (#44740) · 86763023
      Leo Chen 提交于
      * remove cudaDeviceContext
      
      * remove more template
      
      * fix rocm compile
      
      * remove alias name CUDADeviceContext
      
      * fix compile
      
      * fix tests
      
      * revert changes
      86763023
  17. 29 7月, 2022 3 次提交
  18. 26 7月, 2022 1 次提交
  19. 19 7月, 2022 2 次提交
  20. 18 7月, 2022 1 次提交
  21. 13 7月, 2022 1 次提交
  22. 12 7月, 2022 1 次提交
  23. 08 7月, 2022 2 次提交
  24. 07 7月, 2022 2 次提交
  25. 06 7月, 2022 2 次提交
  26. 02 7月, 2022 1 次提交
    • L
      unify cpu context, part2 (#44012) · 755438a7
      Leo Chen 提交于
      * fix init()
      
      * delete test_device_context
      
      * replace CPUDeviceContext with CPUContext
      
      * fix test_scalar
      
      * remove dot_op.cc
      
      * fix compile
      755438a7
  27. 01 7月, 2022 1 次提交
    • L
      Addition of switch_auto_tune option for transpose op (#43310) · 53d5abe3
      limingshu 提交于
      * 2nd part of transpose update
      
      * add switch_auto_tune option.
      
      * add some changes according to Ci
      
      * refine the structure of auto_tune_base.
      
      * merge develop changes
      
      * reset the switch_set_range and change unittest of transpose auto-tune
      
      * change the kernel auto-tune logits
      53d5abe3
  28. 30 6月, 2022 2 次提交
  29. 28 6月, 2022 1 次提交
  30. 26 6月, 2022 1 次提交