1. 08 6月, 2022 1 次提交
    • N
      Replace ReduceAmax/Amax.part.cu with KP (#43202) (#43263) · e161979e
      niuliling123 提交于
      Reduce amax/amin frobenius_norm_kerne原始实现为Eigen实现,文件编译时间较长,因此本PR将其替换为KP实现
      删除DefaultElementwiseOperator中重复功能支持,减少elementwise_double_grad OP编译时间
      e161979e
  2. 07 6月, 2022 1 次提交
  3. 06 6月, 2022 1 次提交
    • N
      cherry-pick 42645 (#43205) · 835a1888
      niuliling123 提交于
      删除Broadcast function中rank例化以及Elementwise调用,降低编译时间。
      从develop分支中的#42645 PR修改而来,由于develop分支与release分支相差较大,无法实现cherry-pick,因此针对release2.3重新提交PR.
      Broadcast中关于rank的例化会导致底层模板展开较多,造成reduce_sum_grad_kernel.cu.o文件体积过大,修改后可以降低.o体积及编译时间
      835a1888
  4. 28 4月, 2022 1 次提交
    • Z
      [cherry-pick] Optimize performance of dygraph (#42196) (#42329) · 2ea56c90
      zyfncg 提交于
      * Optimize performance of dygraph (v4)  (#42196)
      
      * optimize performance of dygraph
      
      * optimize performance of dygraph and elementwise_add
      
      * optimize the trace op
      
      * fix bug
      
      * fix bug
      
      * fix unittest bug
      
      * fix code format
      
      * fix cherry-pick problem
      2ea56c90
  5. 07 3月, 2022 1 次提交
  6. 04 3月, 2022 1 次提交
  7. 02 3月, 2022 1 次提交
  8. 23 2月, 2022 1 次提交
  9. 20 2月, 2022 2 次提交