1. 22 2月, 2023 1 次提交
  2. 15 2月, 2023 1 次提交
  3. 05 1月, 2023 2 次提交
  4. 23 12月, 2022 1 次提交
  5. 22 12月, 2022 1 次提交
  6. 07 12月, 2022 1 次提交
  7. 29 11月, 2022 1 次提交
  8. 22 11月, 2022 1 次提交
    • U
      Fixdocs (#47986) · 91f4d1ce
      ustiniankw 提交于
      * list112-122, test=document_fix
      
      * precommitfix, test=document_fix
      
      * list112-127, test=document_fix
      
      * fix_ResNetBasicBlock, test=document_fix
      
      * pre-commit_resnet, test=document_fix
      
      * refix, test=document
      
      * refix, test=document_fix
      91f4d1ce
  9. 03 11月, 2022 1 次提交
  10. 23 10月, 2022 1 次提交
  11. 20 10月, 2022 1 次提交
  12. 12 10月, 2022 1 次提交
  13. 10 10月, 2022 1 次提交
  14. 23 9月, 2022 1 次提交
  15. 14 9月, 2022 1 次提交
  16. 30 6月, 2022 1 次提交
  17. 28 6月, 2022 1 次提交
  18. 13 6月, 2022 1 次提交
  19. 05 6月, 2022 1 次提交
    • S
      【code format check upgrade】 step2:yapf (#42944) · a072fca8
      Sing_chan 提交于
      * use yapf to format all python file
      
      * yapf exclude two unittests file for they rely on writing and reading file, and format will break them
      
      * disable diff_py_file because too many diff files cause command following failed
      a072fca8
  20. 01 6月, 2022 1 次提交
  21. 30 5月, 2022 1 次提交
  22. 12 5月, 2022 1 次提交
  23. 26 4月, 2022 1 次提交
  24. 28 1月, 2022 1 次提交
  25. 27 1月, 2022 1 次提交
    • Z
      Add SparseCooTensor and SparseCsrTensor (#38906) · a7edb3f3
      zhangkaihuo 提交于
      * fix bug:
      1. atten: set the default value of attn_dropout_rate to None
      2. ffn: add activation parameter
      
      * for pure fp16
      
      * Add a SparseCsrTensor
      
      * remove unused functional
      
      * remove const
      
      * remove SetMemoberTensor
      
      * remove non_zero_nums_, the number of non zero elements of each batch can be obtained from the crows
      
      * SparseCooTensor
      
      * add SetMember
      
      * merge upstream; add SetMember
      
      * merge upstream
      
      * merge upstream; add newline at end of file
      
      * add newline at end of file
      
      * remove newline at end of file
      
      * remove newline at end of file
      
      * stash
      
      * user pten::framework::make_ddim
      
      * user pten::framework::make_ddim
      
      * merge upstream; use the latest mutable_data
      
      * merge upstream; use the latest mutable_data
      
      * return mutable dense tensor
      a7edb3f3
  26. 16 11月, 2021 1 次提交
    • L
      Fix attn_bias_add bug. (#37147) · a9e7a854
      Li Min 提交于
      fused_attention_op的实现中,使用了bias_add,且其实现是通过使用kernel primitive来实现的,之后kernel primitive的WriteData api接口及函数内部实现发生了更改,将判断越界的逻辑移到了template的参数中,使得调用的分支有错误,产生了越界赋值操作,污染了别的显存空间的内容。具体表现为:test_fused_attention_op_api.py 单次执行基本上不会报错,多次循环执行不同shape的输入,结果计算不对,具有偶发性,bug不易察觉。
      a9e7a854
  27. 12 11月, 2021 1 次提交
  28. 28 10月, 2021 1 次提交
  29. 27 10月, 2021 1 次提交
  30. 26 10月, 2021 1 次提交
    • L
      Add fused attention op backward and python layer. (#36498) · 5119428e
      Li Min 提交于
      功能:本PR的目标是提高attention模块的计算性能。
      为了减少框架层对op的调度开销,本PR通过在C++层手动实现attention模块,对外提供attention 大op;
      为了减少防存开销,本PR采取了两种优化方法:
      (1)在q,k,v计算时通过共享输入X,将该处的gemm,transpose和bias add从三次调用减少为一次;
      (2)使用kernel融合优化技术,在不同cuda kernel之间通过寄存器传输数据;
      5119428e