README.md 10.1 KB
Newer Older
1
>运行该示例前请安装Paddle1.6或更高版本和PaddleSlim
2

G
Guanghua Yu 已提交
3
# 模型量化压缩教程
4 5 6

## 概述

7
该示例使用PaddleSlim提供的[量化压缩API](https://paddlepaddle.github.io/PaddleSlim/api/quantization_api/)对检测模型进行压缩。
8 9
在阅读该示例前,建议您先了解以下内容:

10
- [检测模型的常规训练方法](https://github.com/PaddlePaddle/PaddleDetection)
11
- [PaddleSlim使用文档](https://paddlepaddle.github.io/PaddleSlim/)
12
- [自定义量化PACT](https://github.com/PaddlePaddle/PaddleSlim/tree/develop/demo/quant/pact_quant_aware)
13

Q
qingqing01 已提交
14
已发布量化模型见[压缩模型库](../README.md)
15

16 17
## 安装PaddleSlim
可按照[PaddleSlim使用文档](https://paddlepaddle.github.io/PaddleSlim/)中的步骤安装PaddleSlim。
18 19


20 21
## 训练

22
根据 [tools/train.py](https://github.com/PaddlePaddle/PaddleDetection/blob/release/2.1/static/tools/train.py) 编写压缩脚本train.py。脚本中量化的步骤如下。
23 24 25 26 27 28 29 30

### 定义量化配置
config = {
        'weight_quantize_type': 'channel_wise_abs_max',
        'activation_quantize_type': 'moving_average_abs_max',
        'quantize_op_types': ['depthwise_conv2d', 'mul', 'conv2d'],
        'not_quant_pattern': ['yolo_output']
    }
31

32 33 34 35
如何配置以及含义请参考[PaddleSlim 量化API](https://paddlepaddle.github.io/PaddleSlim/api/quantization_api/)

### 插入量化反量化OP
使用[PaddleSlim quant_aware API](https://paddlepaddle.github.io/PaddleSlim/api/quantization_api/#quant_aware)在Program中插入量化和反量化OP。
36
```
37
train_prog = quant_aware(train_prog, place, config, for_test=False)
38 39
```

40
### 关闭一些训练策略
41

42 43 44 45 46
因为量化要对Program做修改,所以一些会修改Program的训练策略需要关闭。``sync_batch_norm`` 和量化多卡训练同时使用时会出错,原因暂不知,因此也需要将其关闭。
```
build_strategy.fuse_all_reduce_ops = False
build_strategy.sync_batch_norm = False
```
47

48
### 开始训练
49

50
您可以通过运行以下命令运行该示例。(该示例是在COCO数据集上训练yolov3-mobilenetv1, 替换模型和数据集的方法和检测库类似,直接替换相应的配置文件即可)
L
Liufang Sang 已提交
51

52
step1: 设置gpu卡
L
Liufang Sang 已提交
53
```
54
export CUDA_VISIBLE_DEVICES=0
L
Liufang Sang 已提交
55
```
56
step2: 开始训练
57 58

请在PaddleDetection根目录下运行。
59 60

```
61
python slim/quantization/train.py --not_quant_pattern yolo_output \
62 63 64 65
    --eval \
    -c ./configs/yolov3_mobilenet_v1.yml \
    -o max_iters=30000 \
    save_dir=./output/mobilenetv1 \
66
    LearningRate.base_lr=0.0001 \
67
    LearningRate.schedulers="[!PiecewiseDecay {gamma: 0.1, milestones: [10000]}]" \
68
    pretrain_weights=https://paddlemodels.bj.bcebos.com/object_detection/yolov3_mobilenet_v1.tar
69 70
```

G
Guanghua Yu 已提交
71 72
**注意:** 目前量化训练中只支持边训练边评估,所以训练时必需携带`--eval`参数,否则无法训练与保存模型。这个量化中的问题未来会持续改进。

73 74
>通过命令行覆设置max_iters选项,因为量化的训练轮次比正常训练小很多,所以需要修改此选项。
如果要调整训练卡数,可根据需要调整配置文件`yolov3_mobilenet_v1_voc.yml`中的以下参数:
75

76
- **max_iters:** 训练的总轮次。
77 78 79
- **LeaningRate.base_lr:** 根据多卡的总`batch_size`调整`base_lr`,两者大小正相关,可以简单的按比例进行调整。
- **LearningRate.schedulers.PiecewiseDecay.milestones:** 请根据batch size的变化对其调整。

80
通过`python slim/quantization/train.py --help`查看可配置参数。
L
Liufang Sang 已提交
81
通过`python ./tools/configure.py help ${option_name}`查看如何通过命令行覆盖配置文件中的参数。
82

83 84 85 86 87 88 89 90 91 92 93 94 95
### PACT自定义量化

```
python slim/quantization/train.py \
    --eval \
    -c ./configs/yolov3_mobilenet_v3.yml \
    -o max_iters=30000 \
    save_dir=./output/mobilenetv3 \
    LearningRate.base_lr=0.0001 \
    LearningRate.schedulers="[!PiecewiseDecay {gamma: 0.1, milestones: [10000]}]" \
    pretrain_weights=https://paddlemodels.bj.bcebos.com/object_detection/yolov3_mobilenet_v3.pdparams \
    --use_pact=True
```
96

97
- 在量化训练时,将`--use_pact=True`,即可选择PACT自定义量化
98

99
### 训练时的模型结构
100 101
[PaddleSlim 量化API](https://paddlepaddle.github.io/PaddleSlim/api/quantization_api/)文档中介绍了``paddleslim.quant.quant_aware````paddleslim.quant.convert``两个接口。
``paddleslim.quant.quant_aware`` 作用是在网络中的conv2d、depthwise_conv2d、mul等算子的各个输入前插入连续的量化op和反量化op,并改变相应反向算子的某些输入。示例图如下:
102 103 104

<p align="center">
<img src="./images/TransformPass.png" height=400 width=520 hspace='10'/> <br />
105
<strong>图1:应用 paddleslim.quant.quant_aware 后的结果</strong>
106 107 108
</p>

### 保存断点(checkpoint)
109 110 111 112 113 114
在脚本中使用保存checkpoint的代码为:
```
# insert quantize op in eval_prog
eval_prog = quant_aware(eval_prog, place, config, for_test=True)
checkpoint.save(exe, eval_prog, os.path.join(save_dir, save_name))
```
115

116
### 边训练边测试
117

118
在脚本中边训练边测试得到的测试精度是基于图1中的网络结构进行的。
119

120
## 评估
121

122
### 最终评估模型
123

124
``paddleslim.quant.convert`` 主要用于改变Program中量化op和反量化op的顺序,即将类似图1中的量化op和反量化op顺序改变为图2中的布局。除此之外,``paddleslim.quant.convert`` 还会将`conv2d``depthwise_conv2d``mul`等算子参数变为量化后的int8_t范围内的值(但数据类型仍为float32),示例如图2:
125 126 127

<p align="center">
<img src="./images/FreezePass.png" height=400 width=420 hspace='10'/> <br />
128
<strong>图2:paddleslim.quant.convert 后的结果</strong>
129 130
</p>

131
所以在调用 ``paddleslim.quant.convert`` 之后,才得到最终的量化模型。此模型可使用PaddleLite进行加载预测,可参见教程[Paddle-Lite如何加载运行量化模型](https://github.com/PaddlePaddle/Paddle-Lite/wiki/model_quantization)
132

133 134
### 评估脚本
使用脚本[slim/quantization/eval.py](./eval.py)进行评估。
135

136 137 138
- 定义配置。使用和训练脚本中一样的量化配置,以得到和量化训练时同样的模型。
- 使用 ``paddleslim.quant.quant_aware`` 插入量化和反量化op。
- 使用 ``paddleslim.quant.convert`` 改变op顺序,得到最终量化模型进行评估。
139

140
评估命令:
L
Liufang Sang 已提交
141 142

```
143
python slim/quantization/eval.py --not_quant_pattern yolo_output  -c ./configs/yolov3_mobilenet_v1.yml \
144
-o weights=./output/mobilenetv1/yolov3_mobilenet_v1/best_model
L
Liufang Sang 已提交
145
```
146

147
## 导出模型
148

149
使用脚本[slim/quantization/export_model.py](./export_model.py)导出模型。
L
Liufang Sang 已提交
150

151 152 153 154 155
- 定义配置。使用和训练脚本中一样的量化配置,以得到和量化训练时同样的模型。
- 使用 ``paddleslim.quant.quant_aware`` 插入量化和反量化op。
- 使用 ``paddleslim.quant.convert`` 改变op顺序,得到最终量化模型进行评估。

导出模型命令:
156

L
Liufang Sang 已提交
157
```
158
 python slim/quantization/export_model.py --not_quant_pattern yolo_output  -c ./configs/yolov3_mobilenet_v1.yml --output_dir ${save path} \
159
-o weights=./output/mobilenetv1/yolov3_mobilenet_v1/best_model
L
Liufang Sang 已提交
160
```
161

L
Liufang Sang 已提交
162 163 164
## 预测

### python预测
165

166
在脚本<a href="./infer.py">slim/quantization/infer.py</a>中展示了如何使用fluid python API加载使用预测模型进行预测。
167 168 169

运行命令示例:
```
170
python slim/quantization/infer.py --not_quant_pattern yolo_output \
171 172 173
-c ./configs/yolov3_mobilenet_v1.yml \
--infer_dir ./demo \
-o weights=./output/mobilenetv1/yolov3_mobilenet_v1/best_model
174
```
L
Liufang Sang 已提交
175 176

### PaddleLite预测
177
导出模型步骤中导出的FP32模型可使用PaddleLite进行加载预测,可参见教程[Paddle-Lite如何加载运行量化模型](https://github.com/PaddlePaddle/Paddle-Lite/wiki/model_quantization)
178

179

180
## 量化模型
181

182 183 184 185 186 187 188 189 190 191 192
### 训练策略

- 量化策略`post`为使用离线量化得到的模型,`aware`为在线量化训练得到的模型。

### YOLOv3 on COCO

| 骨架网络         | 预训练权重 | 量化策略 | 输入尺寸 | Box AP  |                           下载                          |
| :----------------| :--------: | :------: | :------: |:------: | :-----------------------------------------------------: |
| MobileNetV1      |  ImageNet  |   post   |   608    |  27.9   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_mobilenetv1_coco_quant_post.tar) |
| MobileNetV1      |  ImageNet  |   post   |   416    |  28.0   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_mobilenetv1_coco_quant_post.tar) |
| MobileNetV1      |  ImageNet  |   post   |   320    |  26.0   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_mobilenetv1_coco_quant_post.tar) |
193 194 195
| MobileNetV1      |  ImageNet  |  aware   |   608    |  28.1   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_mobilenet_coco_quant_aware.tar) |
| MobileNetV1      |  ImageNet  |  aware   |   416    |  28.2   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_mobilenet_coco_quant_aware.tar) |
| MobileNetV1      |  ImageNet  |  aware   |   320    |  25.8   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_mobilenet_coco_quant_aware.tar) |
196 197 198 199 200 201 202
| ResNet34         |  ImageNet  |   post   |   608    |  35.7   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_r34_coco_quant_post.tar) |
| ResNet34         |  ImageNet  |  aware   |   608    |  35.2   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_r34_coco_quant_aware.tar) |
| ResNet34         |  ImageNet  |  aware   |   416    |  33.3   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_r34_coco_quant_aware.tar) |
| ResNet34         |  ImageNet  |  aware   |   320    |  30.3   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_r34_coco_quant_aware.tar) |
| R50vd-dcn        | object365  |  aware   |   608    |  40.6   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_r50vd_dcn_obj365_pretrained_coco_quant_aware.tar) |
| R50vd-dcn        | object365  |  aware   |   416    |  37.5   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_r50vd_dcn_obj365_pretrained_coco_quant_aware.tar) |
| R50vd-dcn        | object365  |  aware   |   320    |  34.1   | [下载链接](https://paddlemodels.bj.bcebos.com/PaddleSlim/yolov3_r50vd_dcn_obj365_pretrained_coco_quant_aware.tar) |
203 204

## FAQ