1. 09 11月, 2022 1 次提交
  2. 01 8月, 2022 1 次提交
    • L
      unify gpu context (#44740) · 86763023
      Leo Chen 提交于
      * remove cudaDeviceContext
      
      * remove more template
      
      * fix rocm compile
      
      * remove alias name CUDADeviceContext
      
      * fix compile
      
      * fix tests
      
      * revert changes
      86763023
  3. 26 6月, 2022 1 次提交
  4. 19 10月, 2021 1 次提交
  5. 14 10月, 2021 1 次提交
    • Z
      Merge momentum ops/kernels (#36380) · f4eda869
      Zeng Jinle 提交于
      * merge momentum ops
      
      * update
      
      * add ut to improve coverage
      
      * remove optimizer change
      
      * fix error msg
      
      * update ut
      
      * add __restrict__ for CUDA
      
      * update ut
      
      * move merged_momentum_op to optimizer dir
      
      * fix coverage
      f4eda869
  6. 13 9月, 2021 1 次提交
    • Y
      Add searchsorted op (#35159) · 66223048
      Yanxing Shi 提交于
      * fix github name
      
      * fix CI error
      
      * fix review and CI error
      
      * fix inf,nan error and modify unittest samples
      
      * add unittest samples
      
      * add unittest samples
      
      * fix unittest error
      
      * test=document_fix
      
      * test=document_fix
      
      * modify doc and add unittest samples
      
      * fix error newline in constant
      
      * modify doc after mentor review
      
      * modify __all__ and doc
      
      * modify doc
      66223048
  7. 17 8月, 2021 2 次提交
  8. 25 4月, 2021 1 次提交
    • D
      Nne integration (#32255) · feb2e476
      denglin-github 提交于
      * Add dlnne engine runtime
      
      * Fix log
      
      * Remove <const_cast> and remove unrelated modify with dlnne, +clang-format
      
      * Fix CMakeList format error
      
      * Add copyright message
      
      * Fix dlnne CMakeList.txt
      
      * Add some paddlepaddle_pass to support more networks
      
      * Fix some format bug
      feb2e476
  9. 19 3月, 2019 1 次提交
  10. 21 1月, 2019 1 次提交
  11. 10 1月, 2019 1 次提交
  12. 13 12月, 2018 1 次提交
    • S
      fix cmake · deb0d41c
      sneaxiy 提交于
      fix cmake again
      test=develop
      deb0d41c
  13. 10 12月, 2018 1 次提交
  14. 10 9月, 2018 1 次提交
  15. 18 6月, 2018 1 次提交
  16. 24 5月, 2018 1 次提交
  17. 23 5月, 2018 1 次提交
  18. 22 3月, 2018 1 次提交
  19. 07 3月, 2018 2 次提交
  20. 06 3月, 2018 2 次提交
  21. 15 2月, 2018 1 次提交
    • Y
      Update tensor_util.h (#8422) · cfffb1a3
      Yi Wang 提交于
      * Update tensor_util.h
      
      * Update with moved TensorDesc
      
      * Fix tensur_utils.cu
      
      * Update
      
      * Update
      
      * Update
      
      * Update
      
      * Make tensor_util.cu a symbolic link
      cfffb1a3
  22. 10 2月, 2018 2 次提交
  23. 07 2月, 2018 1 次提交
  24. 06 2月, 2018 2 次提交
  25. 01 2月, 2018 1 次提交
  26. 31 1月, 2018 1 次提交
  27. 30 1月, 2018 1 次提交