1. 06 5月, 2022 2 次提交
  2. 05 5月, 2022 3 次提交
  3. 04 5月, 2022 1 次提交
  4. 01 5月, 2022 1 次提交
  5. 25 4月, 2022 1 次提交
  6. 23 4月, 2022 1 次提交
  7. 22 4月, 2022 1 次提交
    • M
      [WIP] Algorithm Cache of cuBlasLt Epilogue (#41010) · 19650d72
      Ming-Xu Huang 提交于
      * Fix leading dimension setting error in fused_gemm_epilogue_grad_op.
      
      * Add dyload to cuBlasLt functions.
      
      * Added cublasLtMatmulAlgoGetHeuristic to improve performance.
      
      * Added FLAGS_cublaslt_exhaustive_search_times to cublasLt epilogue
      
      * Added UTs to FLAGS_cublaslt_exhaustive_search_times
      
      * Added warmup runs in algo searching of Gemm epilogue.
      
      * Update copyright and documents.
      
      * Fixed error handling.
      19650d72
  8. 20 4月, 2022 1 次提交
  9. 19 4月, 2022 3 次提交
  10. 18 4月, 2022 3 次提交
  11. 15 4月, 2022 3 次提交
  12. 14 4月, 2022 4 次提交
  13. 13 4月, 2022 5 次提交
  14. 12 4月, 2022 3 次提交
  15. 11 4月, 2022 2 次提交
  16. 09 4月, 2022 1 次提交
  17. 08 4月, 2022 2 次提交
  18. 07 4月, 2022 3 次提交