• N
    cherry-pick 42645 (#43205) · 835a1888
    niuliling123 提交于
    删除Broadcast function中rank例化以及Elementwise调用,降低编译时间。
    从develop分支中的#42645 PR修改而来,由于develop分支与release分支相差较大,无法实现cherry-pick,因此针对release2.3重新提交PR.
    Broadcast中关于rank的例化会导致底层模板展开较多,造成reduce_sum_grad_kernel.cu.o文件体积过大,修改后可以降低.o体积及编译时间
    835a1888
datamover_primitives_xpu2.h 24.0 KB