1. 15 7月, 2022 1 次提交
  2. 14 7月, 2022 2 次提交
    • Y
      [Phi]Improve the mechanism for mkldnn kernel in PHI (#43941) · e9b4d0be
      YuanRisheng 提交于
      * adapt mkldnn kernel in PHI
      
      * fix ci compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * delete comment
      
      * fix compile bugs in windows-inference
      
      * delete code for converage
      
      * modify code by review
      
      * modify code by review
      
      * add todo
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix unittest bugsx
      e9b4d0be
    • R
      [CustomDevice] add custom ccl 1/2 (#44294) · d88e77a7
      ronnywang 提交于
      * [CustomDevice] add custom ccl api
      
      * add ut
      d88e77a7
  3. 13 7月, 2022 1 次提交
  4. 12 7月, 2022 1 次提交
  5. 06 7月, 2022 1 次提交
  6. 05 7月, 2022 1 次提交
  7. 02 7月, 2022 1 次提交
  8. 28 6月, 2022 1 次提交
  9. 24 6月, 2022 2 次提交
  10. 18 6月, 2022 1 次提交
  11. 16 6月, 2022 1 次提交
  12. 15 6月, 2022 3 次提交
  13. 13 6月, 2022 2 次提交
  14. 09 6月, 2022 1 次提交
  15. 08 6月, 2022 1 次提交
  16. 07 6月, 2022 1 次提交
  17. 05 6月, 2022 1 次提交
  18. 04 6月, 2022 1 次提交
  19. 19 5月, 2022 1 次提交
  20. 13 5月, 2022 1 次提交
  21. 05 5月, 2022 1 次提交
  22. 04 5月, 2022 1 次提交
  23. 22 4月, 2022 1 次提交
    • M
      [WIP] Algorithm Cache of cuBlasLt Epilogue (#41010) · 19650d72
      Ming-Xu Huang 提交于
      * Fix leading dimension setting error in fused_gemm_epilogue_grad_op.
      
      * Add dyload to cuBlasLt functions.
      
      * Added cublasLtMatmulAlgoGetHeuristic to improve performance.
      
      * Added FLAGS_cublaslt_exhaustive_search_times to cublasLt epilogue
      
      * Added UTs to FLAGS_cublaslt_exhaustive_search_times
      
      * Added warmup runs in algo searching of Gemm epilogue.
      
      * Update copyright and documents.
      
      * Fixed error handling.
      19650d72
  24. 21 4月, 2022 1 次提交
  25. 12 4月, 2022 2 次提交
  26. 09 4月, 2022 1 次提交
  27. 01 4月, 2022 1 次提交
    • C
      [Phi]Interploatd kernels into phi (#40855) · d65a7a46
      chentianyu03 提交于
      * add interploate cpu kernel
      
      * fix nullptr bug
      
      * add interpolate gpu kernel
      
      * fix unit test error
      
      * remove raw kernels
      
      * add cuda kernel impl
      
      * add infermeta
      
      * recover accidentally deleted kernels in interpolate op
      
      * fix grad x_grad name error
      
      * remove interpolate_v2_op.h
      
      * rm unused codes
      
      * fix xpu build error
      
      * fix build error
      
      * fix namespace error
      
      * add register header for nup
      
      * fix infermeta error
      
      * modify by review
      
      * add the missing args in test_trt_convert_nearest_interp_v2
      d65a7a46
  28. 25 3月, 2022 2 次提交
  29. 24 3月, 2022 1 次提交
  30. 17 3月, 2022 1 次提交
    • W
      Trt engine. (#40532) · 3082ed46
      Wilber 提交于
      * infrt add trt engine
      
      * fix register
      
      * file generate
      
      * fix ci error
      
      * fix conflict
      
      * add copyright
      
      * update
      
      * update
      
      * update
      
      * update engine name
      
      * refactor trt code
      
      * update
      
      * update
      
      * update
      
      * update
      
      * fix conflict
      
      * update
      
      * fix compile with cuda
      3082ed46
  31. 16 3月, 2022 1 次提交
  32. 15 3月, 2022 1 次提交
  33. 14 3月, 2022 1 次提交
    • L
      fix gpu callback (#40445) · 2c21d240
      Leo Chen 提交于
      * fix gpu conetxt callback
      
      * fix gpu callback
      
      * fix callback early destruct problem
      2c21d240