getting_started.md 3.6 KB
Newer Older
W
WuHaobo 已提交
1 2 3
# 开始使用
---
请事先参考[安装指南](install.md)配置运行环境
W
wangshipeng01 已提交
4
有关模型库的基本信息请参考[README](https://github.com/PaddlePaddle/PaddleClas/blob/master/README.md)
W
WuHaobo 已提交
5

S
fix  
shippingwang 已提交
6
## 一、设置环境变量
W
WuHaobo 已提交
7 8 9 10 11 12 13

**设置PYTHONPATH环境变量:**

```bash
export PYTHONPATH=path_to_PaddleClas:$PYTHONPATH
```

S
fix  
shippingwang 已提交
14
## 二、模型训练与评估
W
WuHaobo 已提交
15 16 17 18

PaddleClas 提供模型训练与评估脚本:tools/train.py和tools/eval.py

### 2.1 模型训练
C
cuicheng01 已提交
19
以flower102数据为例按如下方式启动模型训练,flower数据集准备请参考[数据集准备](./data.md)
W
wangshipeng01 已提交
20

W
WuHaobo 已提交
21 22 23 24 25 26
```bash
# PaddleClas通过launch方式启动多卡多进程训练
# 通过设置FLAGS_selected_gpus 指定GPU运行卡号

python -m paddle.distributed.launch \
    --selected_gpus="0,1,2,3" \
W
wangshipeng01 已提交
27
    --log_dir=log_ResNet50_vd \
W
WuHaobo 已提交
28
    tools/train.py \
W
wangshipeng01 已提交
29
        -c ./configs/flower.yaml 
W
WuHaobo 已提交
30 31 32 33 34 35 36 37 38 39 40 41 42 43
```

- 输出日志示例如下:

```
epoch:0    train    step:13    loss:7.9561    top1:0.0156    top5:0.1094    lr:0.100000    elapse:0.193
```

可以通过添加-o参数来更新配置

```bash
python -m paddle.distributed.launch \
    --selected_gpus="0,1,2,3" \
    --log_dir=log_ResNet50_vd \
W
WuHaobo 已提交
44
    tools/train.py \
W
wangshipeng01 已提交
45
        -c ./configs/flower.yaml \
W
WuHaobo 已提交
46
        -o use_mix=1 
W
WuHaobo 已提交
47 48 49 50 51 52 53 54 55 56 57

```

- 输出日志示例如下:

```
epoch:0    train    step:522    loss:1.6330    lr:0.100000    elapse:0.210
```

或是直接修改模型对应的yaml配置文件,具体配置参数参考[配置文档](config.md)

S
shippingwang 已提交
58
### 2.3 模型微调
W
fix  
wangshipeng01 已提交
59 60 61

以ResNet50_vd和ResNet50_vd_ssld预训练模型对flower102数据集进行微调

C
cuicheng01 已提交
62
ResNet50_vd: 在ImageNet1k数据集上训练 top1 acc:79.1% 模型详细信息参考[模型库](https://paddleclas.readthedocs.io/zh_CN/latest/models/ResNet_and_vd.html)
W
fix  
wangshipeng01 已提交
63

C
cuicheng01 已提交
64
ResNet50_vd_ssld: 在ImageNet1k数据集训练的蒸馏模型 top1: 82.4% 模型详细信息参考[模型库](https://paddleclas.readthedocs.io/zh_CN/latest/models/ResNet_and_vd.html)
W
fix  
wangshipeng01 已提交
65 66 67 68 69 70 71 72 73 74 75

flower数据集相关信息参考[数据文档](data.md)

指定pretrained_model参数初始化预训练模型
ResNet50_vd:

```bash
python -m paddle.distributed.launch \
    --selected_gpus="0" \
    tools/train.py \
        -c ./configs/finetune/ResNet50_vd_finetune.yaml
C
cuicheng01 已提交
76
        -o pretrained_model=path_to_ResNet50_vd_pretrained_models
W
fix  
wangshipeng01 已提交
77 78 79 80 81 82 83 84 85
```

ResNet50_vd_ssld:

```bash
python -m paddle.distributed.launch \
    --selected_gpus="0" \
    tools/train.py \
        -c ./configs/finetune/ResNet50_vd_ssld_finetune.yaml
C
cuicheng01 已提交
86
        -o pretrained_model=path_to_ResNet50_vd_ssld_pretrained_models
W
fix  
wangshipeng01 已提交
87 88 89 90 91
```


在使用ResNet50_vd预训练模型对flower102数据进行模型微调后,top1 acc 达到 92.71%
在使用ResNet50_vd_ssld预训练模型对flower102数据进行模型微调后,top1 acc 达到94.96%
S
shippingwang 已提交
92

W
WuHaobo 已提交
93 94 95 96

### 2.2 模型评估

```bash
W
WuHaobo 已提交
97
python tools/eval.py \
littletomatodonkey's avatar
littletomatodonkey 已提交
98
    -c ./configs/eval.yaml \
W
WuHaobo 已提交
99 100 101 102
    -o architecture="ResNet50_vd" \
    -o pretrained_model=path_to_pretrained_models
```
您可以更改configs/eval.yaml中的architecture字段和pretrained_model字段来配置评估模型,或是通过-o参数更新配置。
S
fix  
shippingwang 已提交
103

S
refine  
shippingwang 已提交
104
## 三、模型推理
S
fix  
shippingwang 已提交
105

S
shippingwang 已提交
106
PaddlePaddle提供三种方式进行预测推理,接下来介绍如何用预测引擎进行推理:
S
fix  
shippingwang 已提交
107
首先,对训练好的模型进行转换
S
shippingwang 已提交
108 109 110 111 112
```bash
python tools/export_model.py \
    -model=模型名字 \
    -pretrained_model=预训练模型路径 \
    -output_path=预测模型保存路径
S
fix  
shippingwang 已提交
113

S
shippingwang 已提交
114 115
```
之后,通过预测引擎进行推理
S
fix  
shippingwang 已提交
116
```bash
W
WuHaobo 已提交
117
python tools/infer/predict.py \
S
shippingwang 已提交
118 119 120 121 122
    -m model文件路径 \
    -p params文件路径 \
    -i 图片路径 \
    --use_gpu=1 \
    --use_tensorrt=True
S
fix  
shippingwang 已提交
123
```
C
cuicheng01 已提交
124
更多使用方法和推理方式请参考[分类预测框架](../extension/paddle_inference.md)