1. 18 10月, 2022 1 次提交
  2. 17 10月, 2022 3 次提交
    • Z
      [cherry-pick]Sparse static graph (#46838) · 10225d22
      zhangkaihuo 提交于
      cherry-pick : #46322, #46245
      Sparse API 支持静态图
      10225d22
    • Z
      Optimize performance of depthwise_conv (#46896) · 976af0da
      Zhang Zheng 提交于
      Optimize performance of depthwise_conv
      
      Config: input[2048, 1024, 4, 4], filter[1024, 1, 4, 4], stride=1, pad=0, dilation=1
      976af0da
    • Z
      [Cherry-Pick]Move valid check from python to kernel (#46980) · 8bfd45ad
      Zhang Zheng 提交于
      为了提升性能,将label的边界检查从python端转移到kernel内,减少额外op的调用,如min、max和同步拷贝等
          当前的模板参数IgnoreIndex仅在ignore_index取值范围在[0, dim)时才生效,但是当某个label值超出了边界,ignore_index等于该label,这种情况下是应该仍然能正常计算。虽然当前的计算逻辑在结果上不会出错,但逻辑上仍是有问题的,且模板参数IgnoreIndex是没有必要的
      8bfd45ad
  3. 13 10月, 2022 1 次提交
  4. 11 10月, 2022 6 次提交
  5. 10 10月, 2022 5 次提交
  6. 29 9月, 2022 2 次提交
  7. 27 9月, 2022 1 次提交
  8. 20 9月, 2022 6 次提交
  9. 19 9月, 2022 4 次提交
  10. 15 9月, 2022 1 次提交
  11. 14 9月, 2022 2 次提交
  12. 13 9月, 2022 1 次提交
  13. 09 9月, 2022 3 次提交
  14. 08 9月, 2022 2 次提交
  15. 07 9月, 2022 2 次提交
    • C
      [Phi] Migrate save kernel (#45665) · fc66fdb7
      Chen Weihang 提交于
      * add save kernel
      
      * add save_sr_kernel
      
      * remove original save_op
      
      * add save gpu kernel
      
      * remove combine kernel
      
      * add port.h include
      
      * add save selected rows test
      
      * remove useless kernel.h
      fc66fdb7
    • H
      [XPU] update xdnn to 0907. (#45777) · 1e981d0d
      houj04 提交于
      * [XPU] update xdnn to 0906. test=kunlun
      
      * [XPU] update xdnn to 0907. test=kunlun
      1e981d0d