1. 11 4月, 2023 1 次提交
    • Y
      Cherry pick for fix of operator precision. (#52705) · d1e8b1e2
      Yiqun Liu 提交于
      * Fix scale kernel for low precision, cherry pick #50998.
      
      * Fix the FP16 precision problem of add_n. (#50129)
      
      * Change squared_l2_norm to reuse ReduceKernel, and register fp16 and bf16 kernel, which is cherry pick #48315.
      
      * Cherry-pick the fix of MPTypeTrait in KP, which is implemented in #50993.
      
      * Cherry-pick the multi-precision support of AdamW for bf16, #48041.
      
      * Fix compiling error.
      
      * Cherry-pick the fix of CubTensorReduceImpl for bfloat16 in #50993.
      
      * Fix unittest.
      
      ---------
      Co-authored-by: Nliuruyan <44316842+liuruyan@users.noreply.github.com>
      d1e8b1e2
  2. 09 4月, 2023 2 次提交
  3. 20 3月, 2023 1 次提交
  4. 09 1月, 2023 1 次提交
  5. 29 12月, 2022 1 次提交
  6. 02 11月, 2022 1 次提交
  7. 24 10月, 2022 1 次提交
  8. 20 10月, 2022 2 次提交
  9. 17 10月, 2022 2 次提交
    • Z
      Optimize performance of depthwise_conv (#46896) · 976af0da
      Zhang Zheng 提交于
      Optimize performance of depthwise_conv
      
      Config: input[2048, 1024, 4, 4], filter[1024, 1, 4, 4], stride=1, pad=0, dilation=1
      976af0da
    • Z
      [Cherry-Pick]Move valid check from python to kernel (#46980) · 8bfd45ad
      Zhang Zheng 提交于
      为了提升性能,将label的边界检查从python端转移到kernel内,减少额外op的调用,如min、max和同步拷贝等
          当前的模板参数IgnoreIndex仅在ignore_index取值范围在[0, dim)时才生效,但是当某个label值超出了边界,ignore_index等于该label,这种情况下是应该仍然能正常计算。虽然当前的计算逻辑在结果上不会出错,但逻辑上仍是有问题的,且模板参数IgnoreIndex是没有必要的
      8bfd45ad
  10. 11 10月, 2022 1 次提交
  11. 29 9月, 2022 1 次提交
  12. 27 9月, 2022 1 次提交
  13. 20 9月, 2022 2 次提交
  14. 19 9月, 2022 3 次提交
  15. 14 9月, 2022 1 次提交
  16. 13 9月, 2022 1 次提交
  17. 09 9月, 2022 1 次提交
  18. 07 9月, 2022 2 次提交
  19. 06 9月, 2022 4 次提交
  20. 05 9月, 2022 1 次提交
  21. 02 9月, 2022 2 次提交
  22. 01 9月, 2022 2 次提交
  23. 31 8月, 2022 3 次提交
    • A
      [OpAttr]output_size of unpool support Tensor type (#45543) · 236ac0d0
      Aurelius84 提交于
      * [OpAttr]output_size of unpool support Tensor type
      
      * fix coverage
      
      * fix contain_var
      
      * fix coverage
      236ac0d0
    • C
      Fix split api bug (#45396) · 4a25b60d
      Charles-hit 提交于
      * fix split bug
      
      * solve function redefine
      
      * fix fluid.layers.split and add unit test
      
      * delete splitInferMeta register in unary.cc
      
      * modify test_split_op GPU unit test
      
      * modify test_split_op GPU unit test place param
      
      * refactor split op and fix infershape bugs
      
      * add () in && and ||
      
      * fix split C++ unit test
      
      * fix split infershape
      4a25b60d
    • L
      Add index add API (#45176) · 45171911
      Li Min 提交于
      45171911
  24. 30 8月, 2022 3 次提交