1. 22 6月, 2022 2 次提交
    • Z
      set_state_dict not use state_dict hook (#43407) (#43711) · 0fb66355
      zhangbo9674 提交于
      在 amp-o2功能开发过程中,为了支持指定网络存储数据类型的功能,添加state_dict hook功能,但是在Layer的set_state_dict是通过state_dict获取网络参数并加载的,hook接口的存在导致 set_state_dict无法加载到原本网络参数。
      本pr通过增加hook控制开关,在set_state_dict中禁用hook解决该问题。
      
      详见pr43407
      0fb66355
    • Z
      [FIx bug]layer to 'NoneType' object has no attribute 'place' (#43597) (#43717) · 0b879318
      zhangbo9674 提交于
      bug:
      当class Layer的_buffers中有参数为None的时候,调用to()方法将会报layer to 'NoneType' object has no attribute 'place'的错误。
      修复方法:
      to()方法增加对_buffers中None类型参数的判断,如果为None,跳过该参数的处理。
      0b879318
  2. 21 6月, 2022 5 次提交
  3. 20 6月, 2022 5 次提交
  4. 18 6月, 2022 1 次提交
  5. 17 6月, 2022 4 次提交
  6. 16 6月, 2022 5 次提交
  7. 15 6月, 2022 1 次提交
  8. 14 6月, 2022 3 次提交
    • S
      Add jetson tool (#43486) · 53a7d38b
      Shang Zhizhou 提交于
      53a7d38b
    • X
      [ CherryPick ] Cherry pick for einsum optimization. (#43468) · 22e75d92
      xiongkun 提交于
      * [EinsumOp] Polish forward logic and backward logic for optimize (#42603)
      
      * change logic for optimize
      
      * modifty
      
      * merge
      
      * change einsum_v2 as default and add new flags: FLAG_einsum_opt=1|0 (#43010)
      
      * [EinsumOp] Make EinsumOp support bfloat16. (#43085)
      
      * change einsum_v2 as default and add new flags: FLAG_einsum_opt=1|0
      
      * make EInsumOP support bf16
      
      * add unittest for BF16
      
      * add condition for test_BF16
      
      * fix bugs
      
      * fix
      
      * change the backward api to fit einsum op
      22e75d92
    • F
      Use tempfile to place all the temporary files. (#43392) · afd0c1db
      freeliuzc 提交于
          使用 tempfile 替换临时文件,保证在单测结束后,所有临时文件都会被正常的删除,避免占用磁盘文件。
          此 PR 仅涉及单测修改,不影响现有功能。
          develop 分支修改在 PR 43376
      afd0c1db
  9. 13 6月, 2022 1 次提交
  10. 09 6月, 2022 3 次提交
  11. 08 6月, 2022 4 次提交
  12. 07 6月, 2022 3 次提交
  13. 06 6月, 2022 1 次提交
    • N
      cherry-pick 42645 (#43205) · 835a1888
      niuliling123 提交于
      删除Broadcast function中rank例化以及Elementwise调用,降低编译时间。
      从develop分支中的#42645 PR修改而来,由于develop分支与release分支相差较大,无法实现cherry-pick,因此针对release2.3重新提交PR.
      Broadcast中关于rank的例化会导致底层模板展开较多,造成reduce_sum_grad_kernel.cu.o文件体积过大,修改后可以降低.o体积及编译时间
      835a1888
  14. 31 5月, 2022 1 次提交
    • T
      Del check size (#43113) · 40a7e0ad
      tianshuo78520a 提交于
      删除判断build目录大小和预测库大小检查功能。该功能是和develop比较,会存在差异,在release任务中取消判断
      40a7e0ad
  15. 30 5月, 2022 1 次提交