1. 01 8月, 2022 1 次提交
    • L
      unify gpu context (#44740) · 86763023
      Leo Chen 提交于
      * remove cudaDeviceContext
      
      * remove more template
      
      * fix rocm compile
      
      * remove alias name CUDADeviceContext
      
      * fix compile
      
      * fix tests
      
      * revert changes
      86763023
  2. 26 6月, 2022 1 次提交
  3. 05 6月, 2022 1 次提交
  4. 30 5月, 2022 1 次提交
  5. 24 5月, 2022 1 次提交
  6. 20 2月, 2022 1 次提交
  7. 18 2月, 2022 1 次提交
  8. 08 2月, 2022 1 次提交
  9. 06 2月, 2022 1 次提交
  10. 18 1月, 2022 1 次提交
  11. 16 12月, 2021 1 次提交
  12. 16 11月, 2021 1 次提交
    • L
      Fix attn_bias_add bug. (#37147) · a9e7a854
      Li Min 提交于
      fused_attention_op的实现中,使用了bias_add,且其实现是通过使用kernel primitive来实现的,之后kernel primitive的WriteData api接口及函数内部实现发生了更改,将判断越界的逻辑移到了template的参数中,使得调用的分支有错误,产生了越界赋值操作,污染了别的显存空间的内容。具体表现为:test_fused_attention_op_api.py 单次执行基本上不会报错,多次循环执行不同shape的输入,结果计算不对,具有偶发性,bug不易察觉。
      a9e7a854
  13. 23 9月, 2021 1 次提交