1. 21 4月, 2023 1 次提交
  2. 11 4月, 2023 1 次提交
    • Y
      Cherry pick for fix of operator precision. (#52705) · d1e8b1e2
      Yiqun Liu 提交于
      * Fix scale kernel for low precision, cherry pick #50998.
      
      * Fix the FP16 precision problem of add_n. (#50129)
      
      * Change squared_l2_norm to reuse ReduceKernel, and register fp16 and bf16 kernel, which is cherry pick #48315.
      
      * Cherry-pick the fix of MPTypeTrait in KP, which is implemented in #50993.
      
      * Cherry-pick the multi-precision support of AdamW for bf16, #48041.
      
      * Fix compiling error.
      
      * Cherry-pick the fix of CubTensorReduceImpl for bfloat16 in #50993.
      
      * Fix unittest.
      
      ---------
      Co-authored-by: Nliuruyan <44316842+liuruyan@users.noreply.github.com>
      d1e8b1e2
  3. 09 4月, 2023 2 次提交
  4. 20 3月, 2023 1 次提交
  5. 13 1月, 2023 1 次提交
  6. 09 1月, 2023 1 次提交
  7. 04 1月, 2023 1 次提交
  8. 03 1月, 2023 1 次提交
  9. 29 12月, 2022 1 次提交
  10. 29 11月, 2022 1 次提交
    • Y
      [cherry-pick] updating mul and matmul with set_mem_desc and fix... · 9e2ba9b9
      yeliang2258 提交于
      [cherry-pick] updating mul and matmul with set_mem_desc and fix squeeze_transpose for MKLDNN (#47951)
      
      * Fix slice bugs in MKLDNN when input dims are zeros (#46671)
      
      * fix slice bugs
      
      * fix
      
      * update code
      
      * fix
      
      * update code
      
      * updating mul and matmul with set_mem_desc (#45624)
      
      * - mul & matmul changes
      
      - fix
      
      - bs16 correction of strides
      
      * - cosmetic fixes
      
      * - lint
      
      * - fix
      
      * - fix
      
      * - format -> mem_desc
      
      * - fix
      
      * - fix
      
      * - fix
      
      * - fix
      
      * - fix
      
      * fix squueze_transpose (#47911)
      Co-authored-by: NJacek Czaja <jacek.czaja@intel.com>
      9e2ba9b9
  11. 25 11月, 2022 1 次提交
  12. 07 11月, 2022 1 次提交
  13. 03 11月, 2022 1 次提交
  14. 02 11月, 2022 1 次提交
  15. 28 10月, 2022 1 次提交
  16. 27 10月, 2022 1 次提交
  17. 24 10月, 2022 1 次提交
  18. 21 10月, 2022 1 次提交
  19. 20 10月, 2022 4 次提交
  20. 19 10月, 2022 2 次提交
  21. 18 10月, 2022 2 次提交
  22. 17 10月, 2022 3 次提交
    • Z
      [cherry-pick]Sparse static graph (#46838) · 10225d22
      zhangkaihuo 提交于
      cherry-pick : #46322, #46245
      Sparse API 支持静态图
      10225d22
    • Z
      Optimize performance of depthwise_conv (#46896) · 976af0da
      Zhang Zheng 提交于
      Optimize performance of depthwise_conv
      
      Config: input[2048, 1024, 4, 4], filter[1024, 1, 4, 4], stride=1, pad=0, dilation=1
      976af0da
    • Z
      [Cherry-Pick]Move valid check from python to kernel (#46980) · 8bfd45ad
      Zhang Zheng 提交于
      为了提升性能,将label的边界检查从python端转移到kernel内,减少额外op的调用,如min、max和同步拷贝等
          当前的模板参数IgnoreIndex仅在ignore_index取值范围在[0, dim)时才生效,但是当某个label值超出了边界,ignore_index等于该label,这种情况下是应该仍然能正常计算。虽然当前的计算逻辑在结果上不会出错,但逻辑上仍是有问题的,且模板参数IgnoreIndex是没有必要的
      8bfd45ad
  23. 13 10月, 2022 1 次提交
  24. 11 10月, 2022 6 次提交
  25. 10 10月, 2022 3 次提交