增加详细复现步骤到readme (#965)

a8c16a7b · itminner · GitHub · 28bea706 · a8c16a7b · a8c16a7b
Showing with 59 addition and 32 deletion

demo/quant/quant_aware_with_infermodel/README.md demo/quant/quant_aware_with_infermodel/README.md +56 -31

paddleslim/quant/quant_aware_with_infermodel.py paddleslim/quant/quant_aware_with_infermodel.py +3 -1

未找到文件。
--- a/demo/quant/quant_aware_with_infermodel/README.md
+++ b/demo/quant/quant_aware_with_infermodel/README.md
 # 使用预测模型进行量化训练示例
-预测模型获取
+预测模型保存接口：
-动态图使用paddle.jit.save保存；
+动态图使用``paddle.jit.save``保存；
-静态图使用paddle.static.save_inference_model保存。
+静态图使用``paddle.static.save_inference_model``保存。
 本示例将介绍如何使用预测模型进行蒸馏量化训练，
 首先使用接口``paddleslim.quant.quant_aware_with_infermodel``训练量化模型，
@@ -10,7 +10,7 @@
 ## 分类模型量化训练流程
-###1. 准备数据
+### 1. 准备数据
 在``demo``文件夹下创建``data``文件夹，将``ImageNet``数据集解压在``data``文件夹下，解压后``data/ILSVRC2012``文件夹下应包含以下文件：
 - ``'train'``文件夹，训练图片
@@ -21,10 +21,25 @@
 ### 2. 准备需要量化的模型
 飞桨图像识别套件PaddleClas是飞桨为工业界和学术界所准备的一个图像识别任务的工具集，本示例使用该套件产出imagenet分类模型。
-####① 下载MobileNetV2预训练模型
+#### ① 下载PaddleClas release/2.3分支代码
-预训练模型库地址 ``https://github.com/PaddlePaddle/PaddleClas/blob/release/2.3/docs/zh_CN/algorithm_introduction/ImageNet_models.md``
+<https://github.com/PaddlePaddle/PaddleClas/archive/refs/heads/release/2.3.zip>
-MobileNetV2预训练模型地址 ``https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/MobileNetV2_pretrained.pdparams``
+解压后，进入PaddleClas目录
-在PaddleClas代码库根目录创建pretrained文件夹，MobileNetV2预训练参数保存在该文件夹中。
+```
+cd PaddleClas-release-2.3
+```
+#### ② 下载MobileNetV2预训练模型
+在PaddleClas根目录创建``pretrained``文件夹：
+```
+mkdir pretrained
+```
+下载预训练模型
+分类预训练模型库地址 <https://github.com/PaddlePaddle/PaddleClas/blob/release/2.3/docs/zh_CN/algorithm_introduction/ImageNet_models.md>
+MobileNetV2预训练模型地址 <https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/MobileNetV2_pretrained.pdparams>
+执行下载命令：
+```
+wget https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/MobileNetV2_pretrained.pdparams -O ./pretrained/MobileNetV2_pretrained.pdparams
+```
 #### ② 导出预测模型
 PaddleClas代码库根目录执行如下命令，导出预测模型
@@ -32,9 +47,13 @@ PaddleClas代码库根目录执行如下命令，导出预测模型
 python tools/export_model.py \
    -c ppcls/configs/ImageNet/MobileNetV2/MobileNetV2.yaml \
    -o Global.pretrained_model=pretrained/MobileNetV2_pretrained \
-    -o Global.save_inference_dir=infermodel_mobilenetv2 \
+    -o Global.save_inference_dir=infermodel_mobilenetv2
 ```
 #### ③ 测试模型精度
+拷贝``infermodel_mobilenetv2``文件夹到``PaddleSlim/demo/quant/quant_aware_with_infermodel/``文件夹。
+```
+cd PaddleSlim/demo/quant/quant_aware_with_infermodel/
+```
 使用[eval.py](../quant_post/eval.py)脚本得到模型的分类精度：
 ```
 python ../quant_post/eval.py --model_path infermodel_mobilenetv2 --model_name inference.pdmodel --params_name inference.pdiparams
@@ -49,16 +68,16 @@ top1_acc/top5_acc= [0.71918 0.90568]
 蒸馏量化训练示例脚本为[quant_aware_with_infermodel.py](./quant_aware_with_infermodel.py)，使用接口``paddleslim.quant.quant_aware_with_infermodel``对模型进行量化训练。运行命令为：
 ```
 python quant_aware_with_infermodel.py \
-    --use_gpu=False \
+    --use_gpu=True \
-    --batch_size=2 \
+    --batch_size=512 \
-    --num_epoch=30 \
+    --num_epoch=1 \
-    --save_iter_step=20 \
+    --save_iter_step=100 \
    --learning_rate=0.0001 \
    --weight_decay=0.00004 \
-    --use_pact=False \
+    --use_pact=True \
-    --checkpoint_path="./inference_model/MobileNet_quantaware_ckpt/" \
+    --checkpoint_path="./MobileNetV2_quantaware_ckpt/" \
-    --model_path_prefix="./inference_model/infermodel_mobilenetv2/inference" \
+    --model_path_prefix="./infermodel_mobilenetv2/inference" \
-    --teacher_model_path_prefix="./inference_model/infermodel_mobilenetv2/inference" \
+    --teacher_model_path_prefix="./infermodel_mobilenetv2/inference" \
    --distill_node_name_list "teacher_conv2d_54.tmp_0" "conv2d_54.tmp_0" "teacher_conv2d_55.tmp_0" "conv2d_55.tmp_0" \
        "teacher_conv2d_57.tmp_0" "conv2d_57.tmp_0" "teacher_elementwise_add_0" "elementwise_add_0" \
        "teacher_conv2d_61.tmp_0" "conv2d_61.tmp_0" "teacher_elementwise_add_1" "elementwise_add_1" \
@@ -70,12 +89,13 @@ python quant_aware_with_infermodel.py \
        "teacher_elementwise_add_9" "elementwise_add_9" "teacher_conv2d_87.tmp_0" "conv2d_87.tmp_0" \
        "teacher_linear_1.tmp_0" "linear_1.tmp_0"
 ```
+- ``use_gpu``: 是否使用GPU。
 - ``batch_size``: 量化训练batch size。
 - ``num_epoch``: 量化训练epoch数。
 - ``save_iter_step``: 每隔save_iter_step保存一次checkpoint。
 - ``learning_rate``: 量化训练学习率，推荐使用float模型训练最小一级学习率。
 - ``weight_decay``: 推荐使用float模型训练weight decay设置。
- ``use_pact``: 是否使用pact量化算法, 推荐使用。
+- ``use_pact``: 是否使用pact量化算法，``推荐使用，量化精度更好``。
 - ``checkpoint_path``: 量化训练模型checkpoint保存路径。
 - ``model_path_prefix``: 需要量化模型的目录 + 模型名称（不包含后缀）
 - ``teacher_model_path_prefix``: teacher模型的目录 + 模型名称（不包含后缀）, 可以和量化模型是同一个，即自蒸馏。
@@ -83,22 +103,23 @@ python quant_aware_with_infermodel.py \
 运行以上命令后，可在``${checkpoint_path}``下看到量化后模型的checkpoint。
+``注意：不需训练一个完整的epoch，精度不再增长即可停止训练。训练中精度测试关键字 top1_acc/top5_acc``
 ### 4. 量化模型导出
 量化模型checkpoint导出为预测模型。
 ```
 python export_quantmodel.py \
-    --use_gpu=False \
+    --use_gpu=True \
-    --batch_size=2 \
+    --batch_size=512 \
-    --num_epoch=30 \
+    --num_epoch=1 \
-    --save_iter_step=20 \
+    --save_iter_step=100 \
    --learning_rate=0.0001 \
    --weight_decay=0.00004 \
-    --use_pact=False \
+    --use_pact=True \
-    --checkpoint_path="./inference_model/MobileNet_quantaware_ckpt/" \
+    --checkpoint_path="./MobileNetV2_quantaware_ckpt/" \
-    --model_path_prefix="./inference_model/infermodel_mobilenetv2/inference" \
+    --model_path_prefix="./infermodel_mobilenetv2/inference" \
-    --teacher_model_path_prefix="./inference_model/infermodel_mobilenetv2/inference" \
+    --teacher_model_path_prefix="./infermodel_mobilenetv2/inference" \
    --distill_node_name_list "teacher_conv2d_54.tmp_0" "conv2d_54.tmp_0" "teacher_conv2d_55.tmp_0" "conv2d_55.tmp_0" \
        "teacher_conv2d_57.tmp_0" "conv2d_57.tmp_0" "teacher_elementwise_add_0" "elementwise_add_0" \
        "teacher_conv2d_61.tmp_0" "conv2d_61.tmp_0" "teacher_elementwise_add_1" "elementwise_add_1" \
@@ -109,8 +130,8 @@ python export_quantmodel.py \
        "teacher_conv2d_81.tmp_0" "conv2d_81.tmp_0" "teacher_elementwise_add_8" "elementwise_add_8" \
        "teacher_elementwise_add_9" "elementwise_add_9" "teacher_conv2d_87.tmp_0" "conv2d_87.tmp_0" \
        "teacher_linear_1.tmp_0" "linear_1.tmp_0" \
-    --checkpoint_filename="epoch_0_iter_20" \
+    --checkpoint_filename="epoch_0_iter_1400" \
-    --export_inference_model_path_prefix="./inference_model/MobileNet_quantaware_ckpt/epoch_0_iter_20_infer"
+    --export_inference_model_path_prefix="./MobileNetV2_quantaware_ckpt/epoch_0_iter_1400_infer"
 ```
 - ``checkpoint_filename``: checkpoint文件名。
 - ``export_inference_model_path_prefix``: 量化模型导出的目录 + 模型名称（不包含后缀）。
@@ -119,9 +140,13 @@ python export_quantmodel.py \
 使用[eval.py](../quant_post/eval.py)脚本对量化后的模型进行精度测试：
 ```
-python ../quant_post/eval.py --model_path ./quant_infermodel_mobilenetv2/ --model_name model --params_name params
+python ../quant_post/eval.py --model_path ./MobileNetV2_quantaware_ckpt --model_name epoch_0_iter_1400_infer.pdmodel  --params_name epoch_0_iter_1400_infer.pdiparams
 ```
 精度输出为:
 ```
-top1_acc/top5_acc= [0.71764 0.90418]
+top1_acc/top5_acc= [0.71922 0.90546]
+```
+如上面各步骤使用参数设定 ``use_pact=False``, 模型最终精度为：
+```
+top1_acc/top5_acc= [0.7181 0.90544]
 ```
--- a/paddleslim/quant/quant_aware_with_infermodel.py
+++ b/paddleslim/quant/quant_aware_with_infermodel.py
@@ -355,6 +355,8 @@ def quant_aware_with_infermodel(executor,
            if iter_num > 0 and iter_num % save_iter_step == 0:
                checkpoint_name = "epoch_" + str(epoch) + "_iter_" + str(
                    iter_num)
+                if not os.path.exists(train_config["quant_model_ckpt_path"]):
+                    os.makedirs(train_config["quant_model_ckpt_path"])
                paddle.static.save(
                    program=test_program,
                    model_path=os.path.join(
@@ -419,7 +421,7 @@ def export_quant_infermodel(
    ############################################################################
    # quant
    ############################################################################
-    use_pact = train_config["use_pact"]
+    use_pact = False  # export model should set use_pact is False
    if use_pact:
        act_preprocess_func = pact
        optimizer_func = get_pact_optimizer