1. 01 8月, 2022 1 次提交
  2. 29 7月, 2022 1 次提交
    • L
      move CUDAStream to phi (#44529) · da3743fd
      Leo Chen 提交于
      * init
      
      * move CUDAStream to phi
      
      * fix compilation
      
      * merge develop
      
      * add stream_owned_ member
      
      * split cuda_stream.h
      
      * fix cpu compile
      
      * fix constructor
      
      * fix bug
      
      * fix windows compile
      
      * fix inference test_levit
      
      * fix windows tests
      da3743fd
  3. 26 7月, 2022 2 次提交
  4. 22 7月, 2022 1 次提交
  5. 20 7月, 2022 1 次提交
  6. 19 7月, 2022 1 次提交
  7. 18 7月, 2022 2 次提交
  8. 15 7月, 2022 1 次提交
  9. 14 7月, 2022 2 次提交
    • Y
      [Phi]Improve the mechanism for mkldnn kernel in PHI (#43941) · e9b4d0be
      YuanRisheng 提交于
      * adapt mkldnn kernel in PHI
      
      * fix ci compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * delete comment
      
      * fix compile bugs in windows-inference
      
      * delete code for converage
      
      * modify code by review
      
      * modify code by review
      
      * add todo
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix unittest bugsx
      e9b4d0be
    • R
      [CustomDevice] add custom ccl 1/2 (#44294) · d88e77a7
      ronnywang 提交于
      * [CustomDevice] add custom ccl api
      
      * add ut
      d88e77a7
  10. 13 7月, 2022 1 次提交
  11. 12 7月, 2022 1 次提交
  12. 06 7月, 2022 1 次提交
  13. 05 7月, 2022 1 次提交
  14. 02 7月, 2022 1 次提交
  15. 28 6月, 2022 1 次提交
  16. 24 6月, 2022 2 次提交
  17. 18 6月, 2022 1 次提交
  18. 16 6月, 2022 1 次提交
  19. 15 6月, 2022 3 次提交
  20. 13 6月, 2022 2 次提交
  21. 09 6月, 2022 1 次提交
  22. 08 6月, 2022 1 次提交
  23. 07 6月, 2022 1 次提交
  24. 05 6月, 2022 1 次提交
  25. 04 6月, 2022 1 次提交
  26. 19 5月, 2022 1 次提交
  27. 13 5月, 2022 1 次提交
  28. 05 5月, 2022 1 次提交
  29. 04 5月, 2022 1 次提交
  30. 22 4月, 2022 1 次提交
    • M
      [WIP] Algorithm Cache of cuBlasLt Epilogue (#41010) · 19650d72
      Ming-Xu Huang 提交于
      * Fix leading dimension setting error in fused_gemm_epilogue_grad_op.
      
      * Add dyload to cuBlasLt functions.
      
      * Added cublasLtMatmulAlgoGetHeuristic to improve performance.
      
      * Added FLAGS_cublaslt_exhaustive_search_times to cublasLt epilogue
      
      * Added UTs to FLAGS_cublaslt_exhaustive_search_times
      
      * Added warmup runs in algo searching of Gemm epilogue.
      
      * Update copyright and documents.
      
      * Fixed error handling.
      19650d72
  31. 21 4月, 2022 1 次提交
  32. 12 4月, 2022 2 次提交