Created by: zhupengyang
- 优化了subgraph:: Engine的执行逻辑,现在更加简单清晰。
- SubgraphEngine现在获得整个program_desc,从program_desc获得原来的sub_block_desc
- 完善了npu的离线保存和读取模型的相关功能,可以作为其它需要此功能的硬件的参考
- 修复了hiai-tensor buffer和lite-tensor buffer共享后会导致崩溃的问题。(hiai-tensor buffer共享给lite-tensor buffer,需要注意只可以由hiai-tensor去释放,而且会随着hiai-tensor的init而自动释放)
- 新增utils:文件读写,计算md5;优化utils:split string