Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
s920243400
PaddleDetection
提交
143536da
P
PaddleDetection
项目概览
s920243400
/
PaddleDetection
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleDetection
通知
2
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleDetection
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
143536da
编写于
8月 15, 2022
作者:
G
Guanghua Yu
提交者:
GitHub
8月 15, 2022
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add picodet full quant demo (#6651)
* add picodet full quant demo * fix reader * fix docs
上级
7f884da6
变更
5
显示空白变更内容
内联
并排
Showing
5 changed file
with
240 addition
and
2 deletion
+240
-2
configs/picodet/FULL_QUANTIZATION.md
configs/picodet/FULL_QUANTIZATION.md
+163
-0
configs/picodet/README.md
configs/picodet/README.md
+1
-1
deploy/auto_compression/README.md
deploy/auto_compression/README.md
+10
-1
deploy/auto_compression/configs/picodet_reader.yml
deploy/auto_compression/configs/picodet_reader.yml
+32
-0
deploy/auto_compression/configs/picodet_s_qat_dis.yaml
deploy/auto_compression/configs/picodet_s_qat_dis.yaml
+34
-0
未找到文件。
configs/picodet/FULL_QUANTIZATION.md
0 → 100644
浏览文件 @
143536da
# PP-PicoDet全量化示例
目录:
-
[
1.简介
](
#1简介
)
-
[
2.Benchmark
](
#2Benchmark
)
-
[
3.全量化流程
](
#全量化流程
)
-
[
3.1 环境准备
](
#31-准备环境
)
-
[
3.2 准备数据集
](
#32-准备数据集
)
-
[
3.3 全精度模型训练
](
#33-全精度模型训练
)
-
[
3.4 导出预测模型
](
#33-导出预测模型
)
-
[
3.5 全量化并产出模型
](
#35-全量化并产出模型
)
-
[
4.预测部署
](
#4预测部署
)
-
[
5.FAQ
](
5FAQ
)
## 1. 简介
本示例以PicoDet为例,介绍从模型训练、模型全量化,到NPU硬件上部署的全流程。
*
[
Benchmark
](
#Benchmark
)
表格中已经提供了基于COCO数据预训练模型全量化的模型。
*
已经验证的NPU硬件:
-
瑞芯微-开发板:Rockchip RV1109、Rockchip RV1126、Rockchip RK1808
-
晶晨-开发板:Amlogic A311D、Amlogic S905D3、Amlogic C308X
-
恩智浦-开发板:NXP i.MX 8M Plus
*
未验证硬件部署思路:
-
未验证,表示该硬件暂不支持Paddle Lite推理部署,可以选择Paddle2ONNX导出,使用硬件的推理引擎完成部署,前提该硬件支持ONNX的全量化模型。
## 2.Benchmark
### PicoDet-S-NPU
| 模型 | 策略 | mAP | FP32 | INT8 | 配置文件 | 模型 |
|:------------- |:-------- |:----:|:----:|:----:|:---------------------------------------------------------------------------------------------------------------------------------:|:-----------------------------------------------------------------------------------:|
| PicoDet-S-NPU | Baseline | 30.1 | - | - |
[
config
](
https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/picodet/picodet_s_416_coco_npu.yml
)
|
[
Model
](
https://bj.bcebos.com/v1/paddle-slim-models/act/picodet_s_416_coco_npu.tar
)
|
| PicoDet-S-NPU | 量化训练 | 29.7 | - | - |
[
config
](
https://github.com/PaddlePaddle/PaddleSlim/tree/develop/demo/full_quantization/detection/configs/picodet_s_qat_dis.yaml
)
|
[
Model
](
https://bj.bcebos.com/v1/paddle-slim-models/act/picodet_s_npu_quant.tar
)
|
-
mAP的指标均在COCO val2017数据集中评测得到,IoU=0.5:0.95。
## 3. 全量化流程
基于自己数据训练的模型,可以参考如下流程。
### 3.1 准备环境
-
PaddlePaddle >= 2.3 (可从
[
Paddle官网
](
https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/linux-pip.html
)
下载安装)
-
PaddleSlim >= 2.3
-
PaddleDet >= 2.4
安装paddlepaddle:
```
shell
# CPU
pip
install
paddlepaddle
# GPU
pip
install
paddlepaddle-gpu
```
安装paddleslim:
```
shell
pip
install
paddleslim
```
安装paddledet:
```
shell
pip
install
paddledet
```
### 3.2 准备数据集
本案例默认以COCO数据进行全量化实验,如果自定义数据,可将数据按照COCO数据的标准准备;其他自定义数据,可以参考
[
PaddleDetection数据准备文档
](
https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.4/docs/tutorials/PrepareDataSet.md
)
来准备。
以PicoDet-S-NPU模型为例,如果已经准备好数据集,请直接修改
[
picodet_reader.yml
](
./configs/picodet_reader.yml
)
中
`EvalDataset`
的
`dataset_dir`
字段为自己数据集路径即可。
### 3.3 全精度模型训练
如需模型全量化,需要准备一个训好的全精度模型,如果已训好模型可跳过该步骤。
-
单卡GPU上训练:
```
shell
# training on single-GPU
export
CUDA_VISIBLE_DEVICES
=
0
python tools/train.py
-c
configs/picodet/picodet_s_416_coco_npu.yml
--eval
```
**注意:**
如果训练时显存out memory,将TrainReader中batch_size调小,同时LearningRate中base_lr等比例减小。同时我们发布的config均由4卡训练得到,如果改变GPU卡数为1,那么base_lr需要减小4倍。
-
多卡GPU上训练:
```
shell
# training on multi-GPU
export
CUDA_VISIBLE_DEVICES
=
0,1,2,3
python
-m
paddle.distributed.launch
--gpus
0,1,2,3 tools/train.py
-c
configs/picodet/picodet_s_416_coco_npu.yml
--eval
```
**注意:**
PicoDet所有模型均由4卡GPU训练得到,如果改变训练GPU卡数,需要按线性比例缩放学习率base_lr。
-
评估:
```
shell
python tools/eval.py
-c
configs/picodet/picodet_s_416_coco_npu.yml
\
-o
weights
=
https://paddledet.bj.bcebos.com/models/picodet_s_416_coco_npu.pdparams
```
### 3.4 导出预测模型
使用如下命令,导出Inference模型,用于全量化训练。导出模型默认存放在
`output_inference`
文件夹,包括
*.pdmodel和*
.pdiparams文件,用于全量化。
*
命令说明:
-
-c:
[
3.3 全精度模型训练
](
#3.3全精度模型训练
)
训练时使用的yam配置文件。
-
-o weight: 预测模型文件,该文档直接使用基于COCO上训练好的模型。
```
shell
python tools/export_model.py
\
-c
configs/picodet/picodet_s_416_coco_npu.yml
\
-o
weights
=
https://paddledet.bj.bcebos.com/models/picodet_s_416_coco_npu.pdparams
\
```
### 3.5 全量化训练并产出模型
-
进入PaddleSlim自动化压缩Demo文件夹下:
```
shell
cd
deploy/auto_compression/
```
全量化示例通过run.py脚本启动,会使用接口
```paddleslim.auto_compression.AutoCompression```
对模型进行全量化。配置config文件中模型路径、蒸馏、量化、和训练等部分的参数,配置完成后便可对模型进行量化和蒸馏。具体运行命令为:
-
单卡量化训练:
```
export CUDA_VISIBLE_DEVICES=0
python run.py --config_path=./configs/picodet_s_qat_dis.yaml --save_dir='./output/'
```
-
多卡量化训练:
```
CUDA_VISIBLE_DEVICES=0,1,2,3
python -m paddle.distributed.launch --log_dir=log --gpus 0,1,2,3 run.py \
--config_path=./configs/picodet_s_qat_dis.yaml --save_dir='./output/'
```
-
最终模型默认产出在
`output`
文件夹下,训练完成后,测试全量化模型精度
将config要测试的模型路径可以在配置文件中
`model_dir`
字段下进行修改。使用eval.py脚本得到模型的mAP:
```
export CUDA_VISIBLE_DEVICES=0
python eval.py --config_path=./configs/picodet_s_qat_dis.yaml
```
## 4.预测部署
请直接使用PicoDet的
[
Paddle Lite全量化Demo
](
https://github.com/PaddlePaddle/Paddle-Lite-Demo/tree/develop/object_detection/linux/picodet_detection
)
进行落地部署。
## 5.FAQ
configs/picodet/README.md
浏览文件 @
143536da
...
@@ -6,7 +6,7 @@
...
@@ -6,7 +6,7 @@
## 最新动态
## 最新动态
-
发布PicoDet-NPU模型,支持模型全量化部署。
**(2022.08.10)**
-
发布PicoDet-NPU模型,支持模型全量化部署。
详情请参考
[
PicoDet全量化示例
](
./FULL_QUANTIZATION.md
)
**(2022.08.10)**
-
发布全新系列PP-PicoDet模型:
**(2022.03.20)**
-
发布全新系列PP-PicoDet模型:
**(2022.03.20)**
-
(1)引入TAL及ETA Head,优化PAN等结构,精度提升2个点以上;
-
(1)引入TAL及ETA Head,优化PAN等结构,精度提升2个点以上;
...
...
deploy/auto_compression/README.md
浏览文件 @
143536da
...
@@ -12,7 +12,7 @@
...
@@ -12,7 +12,7 @@
-
[
4.预测部署
](
#4预测部署
)
-
[
4.预测部署
](
#4预测部署
)
## 1. 简介
## 1. 简介
本示例使用PaddleDetection中Inference部署模型进行自动化压缩
。本示例
使用的自动化压缩策略为量化蒸馏。
本示例使用PaddleDetection中Inference部署模型进行自动化压缩
,
使用的自动化压缩策略为量化蒸馏。
## 2.Benchmark
## 2.Benchmark
...
@@ -26,6 +26,15 @@
...
@@ -26,6 +26,15 @@
-
mAP的指标均在COCO val2017数据集中评测得到,IoU=0.5:0.95。
-
mAP的指标均在COCO val2017数据集中评测得到,IoU=0.5:0.95。
-
PP-YOLOE-l模型在Tesla V100的GPU环境下测试,并且开启TensorRT,batch_size=1,包含NMS,测试脚本是
[
benchmark demo
](
https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.4/deploy/python
)
。
-
PP-YOLOE-l模型在Tesla V100的GPU环境下测试,并且开启TensorRT,batch_size=1,包含NMS,测试脚本是
[
benchmark demo
](
https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.4/deploy/python
)
。
### PP-PicoDet
| 模型 | 策略 | mAP | FP32 | FP16 | INT8 | 配置文件 | 模型 |
| :-------- |:-------- |:--------: | :----------------: | :----------------: | :---------------: | :----------------------: | :---------------------: |
| PicoDet-S-NPU | Baseline | 30.1 | - | - | - |
[
config
](
https://github.com/PaddlePaddle/PaddleDetection/tree/develop/configs/picodet/picodet_s_416_coco_npu.yml
)
|
[
Model
](
https://bj.bcebos.com/v1/paddle-slim-models/act/picodet_s_416_coco_npu.tar
)
|
| PicoDet-S-NPU | 量化训练 | 29.7 | - | - | - |
[
config
](
https://github.com/PaddlePaddle/PaddleSlim/tree/develop/demo/full_quantization/detection/configs/picodet_s_qat_dis.yaml
)
|
[
Model
](
https://bj.bcebos.com/v1/paddle-slim-models/act/picodet_s_npu_quant.tar
)
|
-
mAP的指标均在COCO val2017数据集中评测得到,IoU=0.5:0.95。
## 3. 自动压缩流程
## 3. 自动压缩流程
#### 3.1 准备环境
#### 3.1 准备环境
...
...
deploy/auto_compression/configs/picodet_reader.yml
0 → 100644
浏览文件 @
143536da
metric
:
COCO
num_classes
:
80
# Datset configuration
TrainDataset
:
!COCODataSet
image_dir
:
train2017
anno_path
:
annotations/instances_train2017.json
dataset_dir
:
dataset/coco/
EvalDataset
:
!COCODataSet
image_dir
:
val2017
anno_path
:
annotations/instances_val2017.json
dataset_dir
:
dataset/coco/
worker_num
:
6
eval_height
:
&eval_height
416
eval_width
:
&eval_width
416
eval_size
:
&eval_size
[
*eval_height
,
*eval_width
]
EvalReader
:
sample_transforms
:
-
Decode
:
{}
-
Resize
:
{
interp
:
2
,
target_size
:
*eval_size
,
keep_ratio
:
False
}
-
NormalizeImage
:
{
mean
:
[
0
,
0
,
0
],
std
:
[
1
,
1
,
1
],
is_scale
:
True
}
-
Permute
:
{}
batch_transforms
:
-
PadBatch
:
{
pad_to_stride
:
32
}
batch_size
:
8
shuffle
:
false
deploy/auto_compression/configs/picodet_s_qat_dis.yaml
0 → 100644
浏览文件 @
143536da
Global
:
reader_config
:
./configs/picodet_reader.yml
input_list
:
[
'
image'
,
'
scale_factor'
]
Evaluation
:
True
model_dir
:
./picodet_s_416_coco_npu/
model_filename
:
model.pdmodel
params_filename
:
model.pdiparams
Distillation
:
alpha
:
1.0
loss
:
l2
Quantization
:
use_pact
:
true
activation_quantize_type
:
'
moving_average_abs_max'
weight_bits
:
8
activation_bits
:
8
quantize_op_types
:
-
conv2d
-
depthwise_conv2d
TrainConfig
:
train_iter
:
8000
eval_iter
:
1000
learning_rate
:
type
:
CosineAnnealingDecay
learning_rate
:
0.00001
T_max
:
8000
optimizer_builder
:
optimizer
:
type
:
SGD
weight_decay
:
4.0e-05
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录