1. 05 1月, 2023 1 次提交
  2. 23 12月, 2022 1 次提交
  3. 22 12月, 2022 1 次提交
  4. 07 12月, 2022 1 次提交
  5. 29 11月, 2022 1 次提交
  6. 28 11月, 2022 1 次提交
    • Y
      clear fluid api: warpctc, nce, identity_loss (#48142) · d983fc34
      yuehuayingxueluo 提交于
      * clear fluid api: warpctc, nce, identity_loss
      
      * fix test_layers.py __init__.py
      
      * fix loss.py
      
      * change __init__.py and api calling method
      
      * fix nce
      
      * fix nce
      
      * fix fluid.data
      
      * delete warpctc api document
      
      * fix loss.py
      
      * fix ctc_loss
      
      * fix test_warpctc_op.py
      
      * fix test_layers.py
      
      * fix some bug
      
      * fix conflict
      
      * fix ci bug
      
      * Empty Commit test=allcase
      
      * fix ci bug
      d983fc34
  7. 22 11月, 2022 1 次提交
    • U
      Fixdocs (#47986) · 91f4d1ce
      ustiniankw 提交于
      * list112-122, test=document_fix
      
      * precommitfix, test=document_fix
      
      * list112-127, test=document_fix
      
      * fix_ResNetBasicBlock, test=document_fix
      
      * pre-commit_resnet, test=document_fix
      
      * refix, test=document
      
      * refix, test=document_fix
      91f4d1ce
  8. 03 11月, 2022 1 次提交
  9. 02 11月, 2022 1 次提交
  10. 23 10月, 2022 1 次提交
  11. 20 10月, 2022 1 次提交
  12. 12 10月, 2022 1 次提交
  13. 10 10月, 2022 1 次提交
  14. 23 9月, 2022 1 次提交
  15. 14 9月, 2022 1 次提交
  16. 26 8月, 2022 1 次提交
  17. 30 6月, 2022 1 次提交
  18. 28 6月, 2022 1 次提交
  19. 21 6月, 2022 1 次提交
  20. 17 6月, 2022 1 次提交
  21. 14 6月, 2022 1 次提交
  22. 13 6月, 2022 1 次提交
  23. 05 6月, 2022 1 次提交
    • S
      【code format check upgrade】 step2:yapf (#42944) · a072fca8
      Sing_chan 提交于
      * use yapf to format all python file
      
      * yapf exclude two unittests file for they rely on writing and reading file, and format will break them
      
      * disable diff_py_file because too many diff files cause command following failed
      a072fca8
  24. 01 6月, 2022 1 次提交
  25. 31 5月, 2022 1 次提交
  26. 30 5月, 2022 1 次提交
  27. 12 5月, 2022 1 次提交
  28. 26 4月, 2022 1 次提交
  29. 25 3月, 2022 1 次提交
    • J
      Refactor Dygraph Flags (#40786) · 3085d5e4
      Jiabin Yang 提交于
      * refactor eager flags
      
      * fix flags error when we switch from eager to dygraph
      
      * fix ci problem
      
      * fix ci
      
      * fix ci
      
      * merge develop and fix code style
      
      * merge develop and fix code style
      
      * fix op test error
      
      * fix op test error
      
      * fix op test error
      
      * fix op test error
      
      * fix op test error
      
      * merge develop
      3085d5e4
  30. 11 3月, 2022 1 次提交
  31. 24 2月, 2022 1 次提交
  32. 28 1月, 2022 1 次提交
  33. 27 1月, 2022 1 次提交
    • Z
      Add SparseCooTensor and SparseCsrTensor (#38906) · a7edb3f3
      zhangkaihuo 提交于
      * fix bug:
      1. atten: set the default value of attn_dropout_rate to None
      2. ffn: add activation parameter
      
      * for pure fp16
      
      * Add a SparseCsrTensor
      
      * remove unused functional
      
      * remove const
      
      * remove SetMemoberTensor
      
      * remove non_zero_nums_, the number of non zero elements of each batch can be obtained from the crows
      
      * SparseCooTensor
      
      * add SetMember
      
      * merge upstream; add SetMember
      
      * merge upstream
      
      * merge upstream; add newline at end of file
      
      * add newline at end of file
      
      * remove newline at end of file
      
      * remove newline at end of file
      
      * stash
      
      * user pten::framework::make_ddim
      
      * user pten::framework::make_ddim
      
      * merge upstream; use the latest mutable_data
      
      * merge upstream; use the latest mutable_data
      
      * return mutable dense tensor
      a7edb3f3
  34. 26 11月, 2021 1 次提交
  35. 23 11月, 2021 1 次提交
  36. 16 11月, 2021 1 次提交
    • L
      Fix attn_bias_add bug. (#37147) · a9e7a854
      Li Min 提交于
      fused_attention_op的实现中,使用了bias_add,且其实现是通过使用kernel primitive来实现的,之后kernel primitive的WriteData api接口及函数内部实现发生了更改,将判断越界的逻辑移到了template的参数中,使得调用的分支有错误,产生了越界赋值操作,污染了别的显存空间的内容。具体表现为:test_fused_attention_op_api.py 单次执行基本上不会报错,多次循环执行不同shape的输入,结果计算不对,具有偶发性,bug不易察觉。
      a9e7a854
  37. 12 11月, 2021 1 次提交
  38. 28 10月, 2021 1 次提交
  39. 27 10月, 2021 1 次提交
  40. 26 10月, 2021 1 次提交
    • L
      Add fused attention op backward and python layer. (#36498) · 5119428e
      Li Min 提交于
      功能:本PR的目标是提高attention模块的计算性能。
      为了减少框架层对op的调度开销,本PR通过在C++层手动实现attention模块,对外提供attention 大op;
      为了减少防存开销,本PR采取了两种优化方法:
      (1)在q,k,v计算时通过共享输入X,将该处的gemm,transpose和bias add从三次调用减少为一次;
      (2)使用kernel融合优化技术,在不同cuda kernel之间通过寄存器传输数据;
      5119428e