1. 19 10月, 2022 2 次提交
  2. 18 10月, 2022 2 次提交
  3. 17 10月, 2022 3 次提交
    • Z
      [cherry-pick]Sparse static graph (#46838) · 10225d22
      zhangkaihuo 提交于
      cherry-pick : #46322, #46245
      Sparse API 支持静态图
      10225d22
    • Z
      Optimize performance of depthwise_conv (#46896) · 976af0da
      Zhang Zheng 提交于
      Optimize performance of depthwise_conv
      
      Config: input[2048, 1024, 4, 4], filter[1024, 1, 4, 4], stride=1, pad=0, dilation=1
      976af0da
    • Z
      [Cherry-Pick]Move valid check from python to kernel (#46980) · 8bfd45ad
      Zhang Zheng 提交于
      为了提升性能,将label的边界检查从python端转移到kernel内,减少额外op的调用,如min、max和同步拷贝等
          当前的模板参数IgnoreIndex仅在ignore_index取值范围在[0, dim)时才生效,但是当某个label值超出了边界,ignore_index等于该label,这种情况下是应该仍然能正常计算。虽然当前的计算逻辑在结果上不会出错,但逻辑上仍是有问题的,且模板参数IgnoreIndex是没有必要的
      8bfd45ad
  4. 13 10月, 2022 1 次提交
  5. 11 10月, 2022 6 次提交
  6. 10 10月, 2022 5 次提交
  7. 29 9月, 2022 2 次提交
  8. 27 9月, 2022 1 次提交
  9. 20 9月, 2022 6 次提交
  10. 19 9月, 2022 4 次提交
  11. 15 9月, 2022 1 次提交
  12. 14 9月, 2022 2 次提交
  13. 13 9月, 2022 1 次提交
  14. 09 9月, 2022 3 次提交
  15. 08 9月, 2022 1 次提交
    • P
      [PHI] Migrate cast, clip+grad and pool+grad oneDNN kernels (#45775) · 1a929c31
      piotrekobi 提交于
      * gaussian random
      
      * mkldnn to onednn renaming
      
      * fix merge conflicts
      
      * remove fluid code
      
      * onednn renaming
      
      * Move classes from mkldnn_reuse.h to onednn_reuse.h
      
      * Migrate pool+grad, clip+grad and cast oneDNN kernels to PHI
      
      * Refactor grad kernels into separate files
      
      * Fix CI failures
      
      * Fix Codestyle
      
      * Implement reviewer suggestions
      
      * Add new lines after includes for readability
      Co-authored-by: NSilv3S <slawomir.siwek@intel.com>
      1a929c31