1. 02 3月, 2022 1 次提交
  2. 25 2月, 2022 1 次提交
    • C
      [Phi] Support cudnn kernel moving & move softmax kernels (#39547) · 8895379a
      Chen Weihang 提交于
      * support cudnn kernel moving
      
      * polish cmake rules
      
      * add unittest for coverage
      
      * remove orig kernel
      
      * remove softmax cudnn kernel
      
      * fix softmax test failed
      
      * fix npu func error
      
      * resolve conflict
      
      * rename gpu dnn kernels
      
      * fix name rule error
      
      * fix compile error
      
      * update fp16 namespace
      8895379a
  3. 20 2月, 2022 1 次提交
  4. 20 1月, 2022 1 次提交
  5. 27 12月, 2021 1 次提交
  6. 17 3月, 2021 1 次提交
  7. 07 2月, 2021 1 次提交
  8. 28 1月, 2021 1 次提交
  9. 25 1月, 2021 1 次提交
  10. 20 1月, 2021 1 次提交
    • C
      make abs op support complex types (#30375) · 358106fc
      chentianyu03 提交于
      * rewrite abs op
      
      * rewrite abs op and remove abs in activation
      
      * remove abs register in old codes
      
      * fix abs_grad type error
      
      * fix abs double_grad output name error
      
      * modify abs_grad, abs_grad_grad functor for windows building
      
      * format code style
      
      * fix the bug of result is nan when the divisor is zero
      
      * add missing abs attr and add abs for float16
      358106fc
  11. 16 12月, 2020 1 次提交
    • Y
      添加rocm平台支持代码 (#29342) · 76738504
      Y_Xuan 提交于
      * 添加rocm平台支持代码
      
      * 修改一些问题
      
      * 修改一些歧义并添加备注
      
      * 修改代码格式
      
      * 解决冲突后的代码修改
      
      * 修改operators.cmake
      
      * 修改格式
      
      * 修正错误
      
      * 统一接口
      
      * 修改日期
      76738504
  12. 27 11月, 2020 1 次提交
    • S
      detect tensorRT plugin fp16 in runtime (#27933) · b9e76a01
      Shang Zhizhou 提交于
      * remove -DSUPPORTS_CUDA_FP16 in cuda.cmake
      
      * comile with cuda9
      
      * add some unittest
      
      * notest;test=coverage
      
      * add unittest for trt plugin swish && split
      
      * update ernie unittest
      
      * fix some error message
      
      * remove repeated judgement of CUDA version in mbEltwiseLayerNormOpConverter
      
      * fix comile errror when CUDA_ARCH_NAME < Pascal"
      
      * fix comile error
      
      * update unittest timeout
      
      * compile with cuda9
      
      * update error msg
      
      * fix code style
      
      * add some comments
      
      * add define IF_CUDA_ARCH_SUPPORT_FP16
      
      * rename IF_CUDA_ARCH_SUPPORT_FP16 to CUDA_ARCH_FP16_SUPPORTED
      b9e76a01
  13. 03 12月, 2019 1 次提交
  14. 10 1月, 2019 1 次提交
  15. 11 12月, 2018 1 次提交
  16. 27 11月, 2018 1 次提交
  17. 25 8月, 2018 1 次提交
  18. 24 8月, 2018 1 次提交
  19. 30 7月, 2018 1 次提交
  20. 17 4月, 2018 1 次提交
  21. 10 4月, 2018 1 次提交
  22. 07 4月, 2018 1 次提交
  23. 20 3月, 2018 3 次提交
  24. 07 3月, 2018 1 次提交
    • K
      Integrate float16 into data_type_transform (#8619) · 266ccaa8
      kexinzhao 提交于
      * test cpu float16 data transform
      
      * add isnan etc
      
      * small fix
      
      * fix containsNAN test error
      
      * add data_type transform GPU test
      
      * add float16 GPU example
      
      * fix error
      
      * fix GPU test error
      
      * add context wait
      266ccaa8
  25. 23 2月, 2018 1 次提交
  26. 16 2月, 2018 1 次提交
  27. 13 2月, 2018 1 次提交
  28. 12 2月, 2018 1 次提交
  29. 10 2月, 2018 1 次提交
  30. 15 12月, 2017 1 次提交
  31. 11 12月, 2017 1 次提交
  32. 30 11月, 2017 1 次提交
  33. 29 11月, 2017 2 次提交
  34. 21 11月, 2017 1 次提交
  35. 20 11月, 2017 1 次提交
  36. 17 11月, 2017 2 次提交