Created by: gfwm2013
目前在while_loop的执行过程中,loop_vars中的变量在每次的循环中都会进行拷贝,但是LoDTensorArray类型的变量在while循环体中已经完成了读/写的操作,即完成了更新,此时在进行拷贝属于冗余的操作,故该PR跳过每次循环中loop_vars中LoDTensorArray类型的变量的复制过程。
在PaddleCV/ocr_recognition/atention模型的预测过程中进行性能测试:
性能 | with this PR | without this PR | 提升 |
---|---|---|---|
速度 | 4957.4ms | 4978.47ms | 0.4% |