1. 07 8月, 2023 1 次提交
  2. 11 10月, 2022 1 次提交
  3. 05 8月, 2022 1 次提交
  4. 01 8月, 2022 1 次提交
    • L
      unify gpu context (#44740) · 86763023
      Leo Chen 提交于
      * remove cudaDeviceContext
      
      * remove more template
      
      * fix rocm compile
      
      * remove alias name CUDADeviceContext
      
      * fix compile
      
      * fix tests
      
      * revert changes
      86763023
  5. 26 6月, 2022 1 次提交
  6. 20 2月, 2022 1 次提交
  7. 19 2月, 2022 1 次提交
    • A
      [Pten]Unify paddle/pten::framework::ddim into pten::ddim (#39614) · 2fe04264
      Aurelius84 提交于
      * Unify paddle/pten::framework::ddim into pten::ddim
      
      * fix paddle namespace
      
      * compile sucessfully
      
      * fix npu src file
      
      * fix conflict
      
      * fix conflict
      
      * fix tensorrt compiler error
      
      * fix conflict
      
      * fix conflict
      
      * fix tesst file conflict
      
      * fix conflict
      
      * fix mlu file conflict
      
      * fix mlu file conflict
      
      * fix cinn header file conflict
      
      * fix conflict
      
      * fix conflict
      
      * fix conflict
      
      * fix conflict
      2fe04264
  8. 18 1月, 2022 1 次提交
  9. 15 9月, 2020 1 次提交
  10. 23 2月, 2020 1 次提交
  11. 31 7月, 2019 1 次提交
    • Z
      Trt fp16 support (#18860) · 61238d31
      Zhaolong Xing 提交于
      * Fix Mask rcnn predictor
          1. refine memory optim algorithm to support the model with the block op.
          2. output diff : modify the affine channel fuse
          3. add condition_block_infer op
      add interface for setting trt calib table dir
      test=develop
      
      * add the missing files.
      test=develop
      
      * 1 add trt fp16 support
      test=develop
      61238d31
  12. 25 5月, 2019 1 次提交
    • Z
      TRT: Support set dynamic range in int8 mode. (#17524) · 61221ebc
      Zhaolong Xing 提交于
      * fluid int8 train and trt int8 predict align.
      trt int8 predict init
      op converter
      
      * 2. align fluid int8 train and trt int8 inference.
      enhance quant dequant fuse pass
      enhance op converter, trt engine, trt engine op, trt subgraph pass.
      
      * 3. add delete_quant_dequant_pass for trt
      
      test=develop
      
      * 4. add the missing file
      test=develop
      
      * 5. i modify the c++ interface, but forget to modify the pybind code
      fix the IS_TRT_VERSION_GE bug, and fix elementwise op converter
      test=develop
      61221ebc
  13. 23 5月, 2019 1 次提交
  14. 08 3月, 2019 4 次提交
  15. 27 2月, 2019 1 次提交
  16. 22 2月, 2019 1 次提交
    • N
      5. add static trt load model · 1d5ef7c9
      nhzlx 提交于
      1). add static trt load model
      2). fix bug: when device_id is not 0, the trt will have a bug
      test=develop
      1d5ef7c9
  17. 14 2月, 2019 2 次提交
  18. 22 1月, 2019 1 次提交
    • N
      fix trt stream bug. · ec213730
      nhzlx 提交于
      BUG: After continuing to input different data, the output cannot be aligned
      test=develop
      ec213730
  19. 20 11月, 2018 1 次提交
  20. 21 8月, 2018 1 次提交
  21. 20 8月, 2018 1 次提交
  22. 18 8月, 2018 1 次提交
  23. 17 8月, 2018 1 次提交
  24. 09 8月, 2018 1 次提交
  25. 01 8月, 2018 1 次提交
  26. 26 7月, 2018 1 次提交
  27. 25 7月, 2018 2 次提交
  28. 24 7月, 2018 1 次提交
  29. 23 7月, 2018 1 次提交
  30. 03 7月, 2018 2 次提交
  31. 11 6月, 2018 1 次提交
  32. 08 6月, 2018 1 次提交
  33. 07 6月, 2018 1 次提交
  34. 01 6月, 2018 1 次提交