From c8e4a3d792212ed37c084ab62dd25a7042dd328e Mon Sep 17 00:00:00 2001 From: cnn Date: Mon, 29 Mar 2021 15:56:26 +0800 Subject: [PATCH] fix tensorrt bug of ssd, update doc of tensorrt, test=documet_fix (#2410) --- deploy/TENSOR_RT.md | 15 +++++++++++++++ ppdet/engine/export_utils.py | 2 +- 2 files changed, 16 insertions(+), 1 deletion(-) diff --git a/deploy/TENSOR_RT.md b/deploy/TENSOR_RT.md index 593f7a325..9d97cf294 100644 --- a/deploy/TENSOR_RT.md +++ b/deploy/TENSOR_RT.md @@ -42,6 +42,13 @@ TensorRT版本<=5时,使用TensorRT预测时,只支持固定尺寸输入。 同时需要将图像预处理后的尺寸与设置车模型输入尺寸保持一致,需要设置`infer_cfg.yml`配置文件中`Resize OP`的`target_size`参数和`keep_ratio`参数。 +注意:由于TesnorRT不支持在batch维度进行slice操作,Faster RCNN 和 Mask RCNN使用固定尺寸输入预测会报错,这两个模型请使用动态尺寸输入。 + +以`YOLOv3`为例,使用动态尺寸输入预测: +``` +python python/infer.py --model_dir=../inference_model/yolov3_darknet53_270e_coco/ --image_file=../demo/000000014439_640x640.jpg --use_gpu=True --run_mode=trt_fp32 --run_benchmark=True +``` + ### 3.3 TensorRT动态尺寸预测 TensorRT版本>=6时,使用TensorRT预测时,可以支持动态尺寸输入。 @@ -59,6 +66,11 @@ Paddle预测库关于动态尺寸输入请查看[Paddle CPP预测](https://www.p **注意:`TensorRT`中动态尺寸设置是4维的,这里只设置输入图像的尺寸。** +以`Faster RCNN`为例,使用动态尺寸输入预测: +``` +python python/infer.py --model_dir=../inference_model/faster_rcnn_r50_fpn_1x_coco/ --image_file=../demo/000000014439.jpg --use_gpu=True --run_mode=trt_fp16 --run_benchmark=True --use_dynamic_shape=True --trt_max_shape=1280 --trt_min_shape=800 --trt_opt_shape=960 +``` + ## 4、常见问题QA **Q:** 提示没有`tensorrt_op`
**A:** 请检查是否使用带有TensorRT的Paddle Python包或预测库。 @@ -76,3 +88,6 @@ Paddle预测库关于动态尺寸输入请查看[Paddle CPP预测](https://www.p **Q:** 如何打开日志
**A:** 预测库默认是打开日志的,只要注释掉`config.disable_glog_info()`就可以打开日志 + +**Q:** 开启TensorRT,预测时提示Slice on batch axis is not supported in TensorRT
+**A:** 请尝试使用动态尺寸输入 diff --git a/ppdet/engine/export_utils.py b/ppdet/engine/export_utils.py index bc3092a5a..ab626084f 100644 --- a/ppdet/engine/export_utils.py +++ b/ppdet/engine/export_utils.py @@ -28,7 +28,7 @@ logger = setup_logger('ppdet.engine') # Global dictionary TRT_MIN_SUBGRAPH = { 'YOLO': 3, - 'SSD': 40, + 'SSD': 60, 'RCNN': 40, 'RetinaNet': 40, 'EfficientDet': 40, -- GitLab