1. 31 1月, 2023 1 次提交
  2. 19 1月, 2023 1 次提交
    • H
      [cherry-pick]Fix paddle.queeze_ bug (#49937) · 34fafb11
      heliqi 提交于
      * Fix paddle.queeze_ bug (#49903)
      
      * fix queeze_ bug
      
      * fix slove use squeeze_kernel
      
      * fix slove use squeeze_kernel
      
      * fix slove use squeeze_kernel
      
      * add test case
      
      * Update squeeze_kernel.h
      34fafb11
  3. 13 1月, 2023 1 次提交
  4. 09 1月, 2023 1 次提交
  5. 04 1月, 2023 1 次提交
  6. 03 1月, 2023 1 次提交
  7. 29 12月, 2022 1 次提交
  8. 29 11月, 2022 1 次提交
    • Y
      [cherry-pick] updating mul and matmul with set_mem_desc and fix... · 9e2ba9b9
      yeliang2258 提交于
      [cherry-pick] updating mul and matmul with set_mem_desc and fix squeeze_transpose for MKLDNN (#47951)
      
      * Fix slice bugs in MKLDNN when input dims are zeros (#46671)
      
      * fix slice bugs
      
      * fix
      
      * update code
      
      * fix
      
      * update code
      
      * updating mul and matmul with set_mem_desc (#45624)
      
      * - mul & matmul changes
      
      - fix
      
      - bs16 correction of strides
      
      * - cosmetic fixes
      
      * - lint
      
      * - fix
      
      * - fix
      
      * - format -> mem_desc
      
      * - fix
      
      * - fix
      
      * - fix
      
      * - fix
      
      * - fix
      
      * fix squueze_transpose (#47911)
      Co-authored-by: NJacek Czaja <jacek.czaja@intel.com>
      9e2ba9b9
  9. 25 11月, 2022 1 次提交
  10. 07 11月, 2022 1 次提交
  11. 03 11月, 2022 1 次提交
  12. 02 11月, 2022 1 次提交
  13. 28 10月, 2022 1 次提交
  14. 27 10月, 2022 1 次提交
  15. 24 10月, 2022 1 次提交
  16. 21 10月, 2022 1 次提交
  17. 20 10月, 2022 4 次提交
  18. 19 10月, 2022 2 次提交
  19. 18 10月, 2022 2 次提交
  20. 17 10月, 2022 3 次提交
    • Z
      [cherry-pick]Sparse static graph (#46838) · 10225d22
      zhangkaihuo 提交于
      cherry-pick : #46322, #46245
      Sparse API 支持静态图
      10225d22
    • Z
      Optimize performance of depthwise_conv (#46896) · 976af0da
      Zhang Zheng 提交于
      Optimize performance of depthwise_conv
      
      Config: input[2048, 1024, 4, 4], filter[1024, 1, 4, 4], stride=1, pad=0, dilation=1
      976af0da
    • Z
      [Cherry-Pick]Move valid check from python to kernel (#46980) · 8bfd45ad
      Zhang Zheng 提交于
      为了提升性能,将label的边界检查从python端转移到kernel内,减少额外op的调用,如min、max和同步拷贝等
          当前的模板参数IgnoreIndex仅在ignore_index取值范围在[0, dim)时才生效,但是当某个label值超出了边界,ignore_index等于该label,这种情况下是应该仍然能正常计算。虽然当前的计算逻辑在结果上不会出错,但逻辑上仍是有问题的,且模板参数IgnoreIndex是没有必要的
      8bfd45ad
  21. 13 10月, 2022 1 次提交
  22. 11 10月, 2022 6 次提交
  23. 10 10月, 2022 5 次提交
  24. 29 9月, 2022 1 次提交