• Y
    Optimize linspace to avoid GPU -> CPU copy. (#42750) (#43746) · 4dcfc6df
    Yiqun Liu 提交于
    cherry-pick #42750。
    
    QA反馈,#42750 优化后,solov2模型性能可提升6%,故cherry-pick到2.3。因#41096 将linspace python实现从fluid.layers.tensor挪到了paddle.tensor.creation下,该pr不在release/2.3分支中,故将#42750 中python修改同步到fluid.layers.tensor.linspace中。
    4dcfc6df
linspace_kernel.cu 4.5 KB