1. 18 11月, 2022 1 次提交
    • MarDino's avatar
      Optimize FusedBiasAddGelu Kernel (#47679) · b0e28540
      MarDino 提交于
      * Add quick gelu and fused bias add kernel
      
      * fix annotation
      
      * remove useless code
      
      * add fast gelu option and set it in multi transformer op
      
      * add flag to restrict if use fast gelu approximate
      
      * fix flags conflict
      
      * fix use tanh function instead
      
      * add cudart version limit
      
      * use phi fast tanh func
      
      * fix comment
      b0e28540
  2. 27 10月, 2022 1 次提交
  3. 18 9月, 2022 1 次提交
  4. 01 8月, 2022 1 次提交
    • L
      unify gpu context (#44740) · 86763023
      Leo Chen 提交于
      * remove cudaDeviceContext
      
      * remove more template
      
      * fix rocm compile
      
      * remove alias name CUDADeviceContext
      
      * fix compile
      
      * fix tests
      
      * revert changes
      86763023
  5. 26 6月, 2022 1 次提交
  6. 05 6月, 2022 1 次提交
  7. 04 3月, 2022 1 次提交
  8. 17 9月, 2021 1 次提交
  9. 16 9月, 2021 1 次提交