diff --git a/configs/flower.yaml b/configs/flower.yaml new file mode 100644 index 0000000000000000000000000000000000000000..8375adca1ae8c929970533fb5d6f3384c80fe068 --- /dev/null +++ b/configs/flower.yaml @@ -0,0 +1,74 @@ +mode: 'train' +architecture: 'ResNet50_vd' +pretrained_model: +model_save_dir: "./output/" +classes_num: 102 +total_images: 1020 +save_interval: 10 +validate: True +valid_interval: 1 +epochs: 40 +topk: 5 +image_shape: [3, 224, 224] + +ls_epsilon: 0.1 + +LEARNING_RATE: + function: 'Cosine' + params: + lr: 0.00375 + +OPTIMIZER: + function: 'Momentum' + params: + momentum: 0.9 + regularizer: + function: 'L2' + factor: 0.000001 + +TRAIN: + batch_size: 32 + num_workers: 1 + file_list: "./dataset/flower102/train_list.txt" + data_dir: "./dataset/flower102" + shuffle_seed: 0 + transforms: + - DecodeImage: + to_rgb: True + to_np: False + channel_first: False + - RandCropImage: + size: 224 + - RandFlipImage: + flip_code: 1 + - NormalizeImage: + scale: 1./255. + mean: [0.485, 0.456, 0.406] + std: [0.229, 0.224, 0.225] + order: '' + - ToCHWImage: + #mix: + # - MixupOperator: + # alpha: 0.2 + +VALID: + batch_size: 64 + num_workers: 1 + file_list: "./dataset/flower102/val_list.txt" + data_dir: "./dataset/flower102/" + shuffle_seed: 0 + transforms: + - DecodeImage: + to_rgb: True + to_np: False + channel_first: False + - ResizeImage: + resize_short: 256 + - CropImage: + size: 224 + - NormalizeImage: + scale: 1.0/255.0 + mean: [0.485, 0.456, 0.406] + std: [0.229, 0.224, 0.225] + order: '' + - ToCHWImage: diff --git a/docs/zh_CN/tutorials/data.md b/docs/zh_CN/tutorials/data.md index 1fee05a1048eec08f727eb6e32bc1a8033deb70f..6f4961f85a3796edee906282eb23851739b6e867 100644 --- a/docs/zh_CN/tutorials/data.md +++ b/docs/zh_CN/tutorials/data.md @@ -4,7 +4,7 @@ ## 1.简介 本文档介绍ImageNet1k和Flower102数据准备过程。 -PaddleClas提供了丰富的预训练模型,支持的模型列表请参考[模型库](../models/models_intro.md) +以及PaddleClas提供了丰富的[预训练模型](../models/models_intro.md) ## 2.数据集准备 @@ -14,8 +14,15 @@ PaddleClas提供了丰富的预训练模型,支持的模型列表请参考[模 [ImageNet1k](http://www.image-net.org/challenges/LSVRC/2012/)|1.2M| 50k | 1000 | 数据格式 -PaddleClas加载PaddleClas/dataset/中的数据,通过指定data_dir和file_list来进行加载 +按照如下结构组织数据,其中train_list.txt 和val_list.txt的格式形如 +``` +#path_to_image Class + +ILSVRC2012_val_00000001.JPEG 65 +... + +``` ### ImageNet1k 从官方下载数据后,按如下组织数据 @@ -38,7 +45,7 @@ PaddleClas/dataset/imagenet/ |_ val_list.txt ``` ### Flower -从VGG官方网站下载后的数据,解压后包括 +从[VGG官方网站](https://www.robots.ox.ac.uk/~vgg/data/flowers/102/)下载后的数据,解压后包括 jpg/ setid.mat imagelabels.mat @@ -63,16 +70,6 @@ PaddleClas/dataset/flower102/ |_ val_list.txt ``` -或是通过软链接将数据从实际地址链接到PaddleClas/dataset/下 - -```bash -#imagenet -ln -s actual_path/imagenet path_to_PaddleClas/dataset/imagenet - -#flower -ln -s actual_path/flower path_to_PaddleClas/dataset/flower - -``` ## 3.下载预训练模型 通过tools/download.py下载所需要的预训练模型。 diff --git a/docs/zh_CN/tutorials/finetune.md b/docs/zh_CN/tutorials/finetune.md deleted file mode 100644 index b318527e42746436159a5f070109926794a46be4..0000000000000000000000000000000000000000 --- a/docs/zh_CN/tutorials/finetune.md +++ /dev/null @@ -1,110 +0,0 @@ -# 模型微调 - -本文档将介绍如何使用PaddleClas进行模型微调(finetune) -模型微调使用PaddleClas提供的预训练模型,可以节省从头训练的计算资源和时间,并提高准确率。 - -> 在使用ResNet50_vd_ssld蒸馏模型对flower102数据进行模型微调,仅需要3分钟(V100 单卡)top1即可达到94.96% - - -模型微调大致包括如下四个步骤: -- 初始化预训练模型 -- 剔除FC层 -- 更新参数 -- 新的训练策略 - - -## 初始化预训练模型 - -这里我们以ResNet50_vd和ResNet50_vd_ssld预训练模型对flower102数据集进行微调 - -ResNet50_vd: 在ImageNet1k数据集上训练 top1 acc:79.1% 模型详细信息参考[模型库](https://paddleclas.readthedocs.io/zh_CN/latest/models/ResNet_and_vd.html) - -ResNet50_vd_ssld: 在ImageNet1k数据集训练的蒸馏模型 top1: 82.4% 模型详细信息参考[模型库](https://paddleclas.readthedocs.io/zh_CN/latest/models/ResNet_and_vd.html) - -flower数据集相关信息参考[数据文档](data.md) - -指定pretrained_model参数初始化预训练模型 -ResNet50_vd: - -```bash -python -m paddle.distributed.launch \ - --selected_gpus="0" \ - tools/train.py \ - -c ./configs/finetune/ResNet50_vd_finetune.yaml - -o pretrained_model= ResNet50_vd预训练模型 -``` - -ResNet50_vd_ssld: - -```bash -python -m paddle.distributed.launch \ - --selected_gpus="0" \ - tools/train.py \ - -c ./configs/finetune/ResNet50_vd_ssld_finetune.yaml - -o pretrained_model= ResNet50_vd_ssld预训练模型 -``` - - -## 剔除FC层 - -由于新的数据集类别数(Flower102:102类)和ImgaeNet1k数据(1000类)不一致,一般需要对分类网络的最后FC层进行调整,PaddleClas默认剔除所有形状不一样的层 - -```python -#excerpt from PaddleClas/ppcls/utils/save_load.py - -def load_params(exe, prog, path): - # ... - - ignore_set = set() - state = _load_state(path) - - # 剔除预训练模型和模型间形状不一致的参数 - - all_var_shape = {} - for block in prog.blocks: - for param in block.all_parameters(): - all_var_shape[param.name] = param.shape - ignore_set.update([ - name for name, shape in all_var_shape.items() - if name in state and shape != state[name].shape - ]) - - # 用于迁移学习的代码段已被省略 ... - - if len(ignore_set) > 0: - for k in ignore_set: - if k in state: - # 剔除参数 - del state[k] - fluid.io.set_program_state(prog, state) -``` -在将shape不一致的层进行剔除正确加载预训练模型后,我们要选择需要更新的参数来让优化器进行参数更新。 - -## 更新参数 - -首先,分类网络中的卷积层大致可以分为 - -- ```浅层卷积层```:用于提取基础特征 -- ```深层卷积层```:用于提取抽象特征 -- ```FC层```:进行特征组合 - -其次,在衡量数据集大小差别和数据集的相似程度后,我们一般遵循如下的规则进行参数更新: - -- 1. 新的数据集很小,在类别,具体种类上和原数据很像。由于新数据集很小,这里可能出现过拟合的问题;由于数据很像,可以认为预训练模型的深层特征仍然会起作用,只需要训练一个最终的```FC层```即可。 -- 2. 新的数据集很大,在类别,具体种类上和原数据很像。推荐训练网络中全部层的参数。 -- 3. 新的数据集很小但是和原数据不相像,可以冻结网络中初始层的参数更新```stop_gradient=True```,对较高层进行重新训练。 -- 4. 新的数据集很大但是和原数据不相像,这时候预训练模型可能不会生效,需要从头训练。 - -PaddleClas模型微调默认更新所有层参数。 - -## 新的训练策略 - -1. 学习率 -由于已经加载了预训练模型,对于从头训练的随机初始化参数来讲,模型中的参数已经具备了一定的分类能力,所以建议使用与从头训练相比更小的学习率,例如减小10倍。 -2. 类别数和总图片数调整为新数据集数据 -3. 调整训练轮数,由于不需要从头开始训练,一般相对减少模型微调的训练轮数 - -## 模型微调结果 - -在使用ResNet50_vd预训练模型对flower102数据进行模型微调后,top1 acc 达到 92.71% -在使用ResNet50_vd_ssld预训练模型对flower102数据进行模型微调后,top1 acc 达到94.96% diff --git a/docs/zh_CN/tutorials/getting_started.md b/docs/zh_CN/tutorials/getting_started.md index 0945114b69540d43fb502b48f8d9df9f3e4d33b9..251ad2e04e651345370bfa859e306c893fe0587e 100644 --- a/docs/zh_CN/tutorials/getting_started.md +++ b/docs/zh_CN/tutorials/getting_started.md @@ -56,7 +56,39 @@ epoch:0 train step:522 loss:1.6330 lr:0.100000 elapse:0.210 或是直接修改模型对应的yaml配置文件,具体配置参数参考[配置文档](config.md)。 ### 2.3 模型微调 -模型微调请参照[模型微调文档](./finetune.md) + +以ResNet50_vd和ResNet50_vd_ssld预训练模型对flower102数据集进行微调 + +ResNet50_vd: 在ImageNet1k数据集上训练 top1 acc:79.1% 模型详细信息参考[模型库](https://paddleclas.readthedocs.io/zh_CN/latest/models/ResNet_and_vd.html) + +ResNet50_vd_ssld: 在ImageNet1k数据集训练的蒸馏模型 top1: 82.4% 模型详细信息参考[模型库](https://paddleclas.readthedocs.io/zh_CN/latest/models/ResNet_and_vd.html) + +flower数据集相关信息参考[数据文档](data.md) + +指定pretrained_model参数初始化预训练模型 +ResNet50_vd: + +```bash +python -m paddle.distributed.launch \ + --selected_gpus="0" \ + tools/train.py \ + -c ./configs/finetune/ResNet50_vd_finetune.yaml + -o pretrained_model= ResNet50_vd预训练模型 +``` + +ResNet50_vd_ssld: + +```bash +python -m paddle.distributed.launch \ + --selected_gpus="0" \ + tools/train.py \ + -c ./configs/finetune/ResNet50_vd_ssld_finetune.yaml + -o pretrained_model= ResNet50_vd_ssld预训练模型 +``` + + +在使用ResNet50_vd预训练模型对flower102数据进行模型微调后,top1 acc 达到 92.71% +在使用ResNet50_vd_ssld预训练模型对flower102数据进行模型微调后,top1 acc 达到94.96% ### 2.2 模型评估