1. 01 3月, 2022 1 次提交
  2. 25 2月, 2022 1 次提交
  3. 23 2月, 2022 1 次提交
  4. 15 12月, 2021 1 次提交
  5. 07 12月, 2021 1 次提交
  6. 26 10月, 2021 1 次提交
  7. 14 9月, 2021 1 次提交
  8. 31 8月, 2021 1 次提交
  9. 27 8月, 2021 2 次提交
  10. 26 8月, 2021 1 次提交
    • S
      Add copy from tensor (#34406) · ac33c0ca
      Shang Zhizhou 提交于
      * add api
      
      * temp save
      
      * revert
      
      * copytocpu async ok
      
      * fix style
      
      * copy sync ok
      
      * fix compile error
      
      * fix compile error
      
      * api done
      
      * update python async api
      
      * fix compile
      
      * remove async python api; add c++ async unittest
      
      * remove python async api
      
      * update unittest
      
      * update unittest
      
      * add C++ unittest for copytensor
      
      * add unittest
      
      * update namespace utils to class TensorUtils
      
      * add unittest
      
      * update unittest
      
      * update unittest
      
      * update code style
      
      * update code style
      
      * update unittest
      ac33c0ca
  11. 09 6月, 2021 1 次提交
  12. 01 6月, 2021 1 次提交
  13. 26 5月, 2021 1 次提交
  14. 19 5月, 2021 1 次提交
  15. 24 4月, 2021 1 次提交
  16. 29 3月, 2021 1 次提交
  17. 25 2月, 2021 2 次提交
  18. 20 2月, 2021 1 次提交
  19. 03 2月, 2021 1 次提交
  20. 01 2月, 2021 1 次提交
  21. 21 1月, 2021 1 次提交
  22. 20 1月, 2021 1 次提交
  23. 29 12月, 2020 1 次提交
  24. 11 12月, 2020 1 次提交
  25. 02 12月, 2020 1 次提交
  26. 30 11月, 2020 1 次提交
  27. 27 11月, 2020 1 次提交
    • S
      detect tensorRT plugin fp16 in runtime (#27933) · b9e76a01
      Shang Zhizhou 提交于
      * remove -DSUPPORTS_CUDA_FP16 in cuda.cmake
      
      * comile with cuda9
      
      * add some unittest
      
      * notest;test=coverage
      
      * add unittest for trt plugin swish && split
      
      * update ernie unittest
      
      * fix some error message
      
      * remove repeated judgement of CUDA version in mbEltwiseLayerNormOpConverter
      
      * fix comile errror when CUDA_ARCH_NAME < Pascal"
      
      * fix comile error
      
      * update unittest timeout
      
      * compile with cuda9
      
      * update error msg
      
      * fix code style
      
      * add some comments
      
      * add define IF_CUDA_ARCH_SUPPORT_FP16
      
      * rename IF_CUDA_ARCH_SUPPORT_FP16 to CUDA_ARCH_FP16_SUPPORTED
      b9e76a01
  28. 26 11月, 2020 1 次提交
  29. 13 11月, 2020 1 次提交
  30. 12 11月, 2020 1 次提交
  31. 08 11月, 2020 1 次提交
    • Y
      exec ut no more than 15s 1 (#28439) · ba075632
      YUNSHEN XIE 提交于
      * disable ut test_parallel_executor_fetch_isolated_var,test=document_fix
      
      * test for limiting ut exec time as 15S
      
      * fix an error caused by cannot find ut
      
      * fix some error
      
      * can not find test_transformer
      
      * fix error caused by ut not run in windows
      
      * fix error caused by Compiler Options
      
      * fix error caused by setting timeout value as 15 in python/paddle/tests/CMakeLists.txt
      
      * setting timeout value to 120s for old ut
      
      * add the timeout value setting
      
      * fix error caused by ut only run in coverage_ci
      
      * add analyzer_transformer_profile_tester
      
      * fix some error
      
      * fix some error
      
      * fix error with inference option
      
      * fix error with inference option setting as ON_INFER
      
      * add some ut to set timeout
      
      * modified some option
      
      * fix error
      
      * fix some timeout error
      
      * fix error
      
      * fix error
      
      * fix timeout for test_analyzer_bfloat16_resnet50
      
      * fix error
      
      * setting timeout properity for some ut
      
      * first pr for new ut timeout as 15S
      ba075632
  32. 15 10月, 2020 1 次提交
  33. 13 10月, 2020 1 次提交
  34. 25 9月, 2020 1 次提交
  35. 23 9月, 2020 1 次提交
  36. 17 9月, 2020 1 次提交
  37. 16 9月, 2020 1 次提交
  38. 15 9月, 2020 1 次提交