Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleSlim
提交
c90dc519
P
PaddleSlim
项目概览
PaddlePaddle
/
PaddleSlim
1 年多 前同步成功
通知
51
Star
1434
Fork
344
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
53
列表
看板
标记
里程碑
合并请求
16
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleSlim
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
53
Issue
53
列表
看板
标记
里程碑
合并请求
16
合并请求
16
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
c90dc519
编写于
2月 02, 2021
作者:
B
Bai Yifan
提交者:
GitHub
2月 02, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add trt/x86cpu deploy doc (#630)
* add trt/x86cpu deploy doc
上级
e7e13005
变更
4
隐藏空白更改
内联
并排
Showing
4 changed file
with
21 addition
and
3 deletion
+21
-3
demo/mkldnn_quant/README.md
demo/mkldnn_quant/README.md
+1
-1
demo/quant/deploy/TensorRT/README.md
demo/quant/deploy/TensorRT/README.md
+18
-2
docs/zh_cn/tutorials/deploy/deploy_cls_model_on_nvidia_gpu.md
.../zh_cn/tutorials/deploy/deploy_cls_model_on_nvidia_gpu.md
+1
-0
docs/zh_cn/tutorials/deploy/deploy_cls_model_on_x86_cpu.md
docs/zh_cn/tutorials/deploy/deploy_cls_model_on_x86_cpu.md
+1
-0
未找到文件。
demo/mkldnn_quant/README.md
浏览文件 @
c90dc519
#
图像分类
INT8量化模型在CPU上的部署和预测
#
PaddleSlim
INT8量化模型在CPU上的部署和预测
## 概述
## 概述
...
...
demo/quant/deploy/TensorRT/README.md
浏览文件 @
c90dc519
# PaddleSlim
量化模型的TensorRT
预测
# PaddleSlim
INT8量化模型使用TensorRT的部署和
预测
本教程将介绍使用TensortRT部署PaddleSlim量化得到的模型的详细步骤。
## 概述
NVIDIA TensorRT 是一个高性能的深度学习预测库,适用于Nvidia GPU,可为深度学习推理应用程序提供低延迟和高吞吐量。PaddlePaddle 采用子图的形式对TensorRT进行了集成,即我们可以使用该模块来提升Paddle模型的预测性能。本教程将介绍如何使用TensortRT部署PaddleSlim量化得到的模型,无论是量化训练(QAT)还是离线量化(PTQ)模型均可支持。对于常见图像分类模型,INT8模型的推理速度通常是FP32模型的3.2-6.7倍。
流程步骤如下:
-
产出量化模型:使用PaddleSlim量化训练或离线量化得到量化模型。注意模型中被量化的算子的参数值应该在INT8范围内,但是类型仍为float型。
-
在Nvidia GPU上部署预测:在GPU上以INT8类型进行预测部署。
## 1. 准备环境
## 1. 准备环境
...
@@ -157,6 +163,16 @@ val/ILSVRC2012_val_00000002.jpg 0
...
@@ -157,6 +163,16 @@ val/ILSVRC2012_val_00000002.jpg 0
### 2.4 部署预测
### 2.4 部署预测
相比FP32模型的TensorRT预测,量化模型的预测需要在开启TensorRT时另外设定精度为
`kInt8`
, 核心代码如下:
```
python
config
.
EnableTensorRtEngine
(
workspace_size
,
\
batch_size
,
\
min_subgraph_size
,
\
paddle
::
AnalysisConfig
::
Precision
::
kInt8
,
\
false
,
\
false
);
```
### 运行demo
### 运行demo
*
执行以下命令,完成一个分类模型的TensorRT预测。
*
执行以下命令,完成一个分类模型的TensorRT预测。
...
...
docs/zh_cn/tutorials/deploy/deploy_cls_model_on_nvidia_gpu.md
0 → 120000
浏览文件 @
c90dc519
../../../../demo/quant/deploy/TensorRT/README.md
\ No newline at end of file
docs/zh_cn/tutorials/deploy/deploy_cls_model_on_x86_cpu.md
0 → 120000
浏览文件 @
c90dc519
../../../../demo/mkldnn_quant/README.md
\ No newline at end of file
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录