1. 14 7月, 2022 2 次提交
    • Y
      [Phi]Improve the mechanism for mkldnn kernel in PHI (#43941) · e9b4d0be
      YuanRisheng 提交于
      * adapt mkldnn kernel in PHI
      
      * fix ci compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * delete comment
      
      * fix compile bugs in windows-inference
      
      * delete code for converage
      
      * modify code by review
      
      * modify code by review
      
      * add todo
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix compile bugs
      
      * fix unittest bugsx
      e9b4d0be
    • R
      [CustomDevice] add custom ccl 1/2 (#44294) · d88e77a7
      ronnywang 提交于
      * [CustomDevice] add custom ccl api
      
      * add ut
      d88e77a7
  2. 13 7月, 2022 1 次提交
  3. 12 7月, 2022 1 次提交
  4. 06 7月, 2022 1 次提交
  5. 05 7月, 2022 1 次提交
  6. 02 7月, 2022 1 次提交
  7. 28 6月, 2022 1 次提交
  8. 24 6月, 2022 2 次提交
  9. 18 6月, 2022 1 次提交
  10. 16 6月, 2022 1 次提交
  11. 15 6月, 2022 3 次提交
  12. 13 6月, 2022 2 次提交
  13. 09 6月, 2022 1 次提交
  14. 08 6月, 2022 1 次提交
  15. 07 6月, 2022 1 次提交
  16. 05 6月, 2022 1 次提交
  17. 04 6月, 2022 1 次提交
  18. 19 5月, 2022 1 次提交
  19. 13 5月, 2022 1 次提交
  20. 05 5月, 2022 1 次提交
  21. 04 5月, 2022 1 次提交
  22. 22 4月, 2022 1 次提交
    • M
      [WIP] Algorithm Cache of cuBlasLt Epilogue (#41010) · 19650d72
      Ming-Xu Huang 提交于
      * Fix leading dimension setting error in fused_gemm_epilogue_grad_op.
      
      * Add dyload to cuBlasLt functions.
      
      * Added cublasLtMatmulAlgoGetHeuristic to improve performance.
      
      * Added FLAGS_cublaslt_exhaustive_search_times to cublasLt epilogue
      
      * Added UTs to FLAGS_cublaslt_exhaustive_search_times
      
      * Added warmup runs in algo searching of Gemm epilogue.
      
      * Update copyright and documents.
      
      * Fixed error handling.
      19650d72
  23. 21 4月, 2022 1 次提交
  24. 12 4月, 2022 2 次提交
  25. 09 4月, 2022 1 次提交
  26. 01 4月, 2022 1 次提交
    • C
      [Phi]Interploatd kernels into phi (#40855) · d65a7a46
      chentianyu03 提交于
      * add interploate cpu kernel
      
      * fix nullptr bug
      
      * add interpolate gpu kernel
      
      * fix unit test error
      
      * remove raw kernels
      
      * add cuda kernel impl
      
      * add infermeta
      
      * recover accidentally deleted kernels in interpolate op
      
      * fix grad x_grad name error
      
      * remove interpolate_v2_op.h
      
      * rm unused codes
      
      * fix xpu build error
      
      * fix build error
      
      * fix namespace error
      
      * add register header for nup
      
      * fix infermeta error
      
      * modify by review
      
      * add the missing args in test_trt_convert_nearest_interp_v2
      d65a7a46
  27. 25 3月, 2022 2 次提交
  28. 24 3月, 2022 1 次提交
  29. 17 3月, 2022 1 次提交
    • W
      Trt engine. (#40532) · 3082ed46
      Wilber 提交于
      * infrt add trt engine
      
      * fix register
      
      * file generate
      
      * fix ci error
      
      * fix conflict
      
      * add copyright
      
      * update
      
      * update
      
      * update
      
      * update engine name
      
      * refactor trt code
      
      * update
      
      * update
      
      * update
      
      * update
      
      * fix conflict
      
      * update
      
      * fix compile with cuda
      3082ed46
  30. 16 3月, 2022 1 次提交
  31. 15 3月, 2022 1 次提交
  32. 14 3月, 2022 1 次提交
    • L
      fix gpu callback (#40445) · 2c21d240
      Leo Chen 提交于
      * fix gpu conetxt callback
      
      * fix gpu callback
      
      * fix callback early destruct problem
      2c21d240
  33. 11 3月, 2022 1 次提交