1. 21 6月, 2022 1 次提交
  2. 20 6月, 2022 5 次提交
  3. 18 6月, 2022 1 次提交
  4. 17 6月, 2022 4 次提交
  5. 16 6月, 2022 5 次提交
  6. 15 6月, 2022 1 次提交
  7. 14 6月, 2022 3 次提交
    • S
      Add jetson tool (#43486) · 53a7d38b
      Shang Zhizhou 提交于
      53a7d38b
    • X
      [ CherryPick ] Cherry pick for einsum optimization. (#43468) · 22e75d92
      xiongkun 提交于
      * [EinsumOp] Polish forward logic and backward logic for optimize (#42603)
      
      * change logic for optimize
      
      * modifty
      
      * merge
      
      * change einsum_v2 as default and add new flags: FLAG_einsum_opt=1|0 (#43010)
      
      * [EinsumOp] Make EinsumOp support bfloat16. (#43085)
      
      * change einsum_v2 as default and add new flags: FLAG_einsum_opt=1|0
      
      * make EInsumOP support bf16
      
      * add unittest for BF16
      
      * add condition for test_BF16
      
      * fix bugs
      
      * fix
      
      * change the backward api to fit einsum op
      22e75d92
    • F
      Use tempfile to place all the temporary files. (#43392) · afd0c1db
      freeliuzc 提交于
          使用 tempfile 替换临时文件,保证在单测结束后,所有临时文件都会被正常的删除,避免占用磁盘文件。
          此 PR 仅涉及单测修改,不影响现有功能。
          develop 分支修改在 PR 43376
      afd0c1db
  8. 13 6月, 2022 1 次提交
  9. 09 6月, 2022 3 次提交
  10. 08 6月, 2022 4 次提交
  11. 07 6月, 2022 3 次提交
  12. 06 6月, 2022 1 次提交
    • N
      cherry-pick 42645 (#43205) · 835a1888
      niuliling123 提交于
      删除Broadcast function中rank例化以及Elementwise调用,降低编译时间。
      从develop分支中的#42645 PR修改而来,由于develop分支与release分支相差较大,无法实现cherry-pick,因此针对release2.3重新提交PR.
      Broadcast中关于rank的例化会导致底层模板展开较多,造成reduce_sum_grad_kernel.cu.o文件体积过大,修改后可以降低.o体积及编译时间
      835a1888
  13. 31 5月, 2022 1 次提交
    • T
      Del check size (#43113) · 40a7e0ad
      tianshuo78520a 提交于
      删除判断build目录大小和预测库大小检查功能。该功能是和develop比较,会存在差异,在release任务中取消判断
      40a7e0ad
  14. 30 5月, 2022 2 次提交
  15. 27 5月, 2022 4 次提交
  16. 26 5月, 2022 1 次提交