PaddlePaddle / Paddle
大约 2 年前同步成功

代码
- 文件
- 提交
- 分支
- Tags
- 贡献者
- 分支图
- Diff
Issue 1423
- 列表
- 看板
- 标记
- 里程碑
合并请求 543
Wiki 0
- Wiki
分析
- 仓库
- DevOps
项目成员
Pages

tensorRT子图预测在高并发的时候，相比原生 paddle 预测速度下降很多

Created by: QsJack

RT

单并发执行没问题，但是并发数上来后，tensorRT 子图预测的速度下降非常多。主干网络是 resnet50，任务是检测。

从测试的 qps 上来看，6个并发，tensorRT的 qps=1.1+，原始 fluid 的预测 qps=3+。