whl.md 9.1 KB
Newer Older
1 2 3 4 5 6
# PaddleClas Whl 使用说明

PaddleClas 支持 Python Whl 包方式进行预测,目前 Whl 包方式仅支持图像分类,暂不支持主体检测、特征提取及向量检索。

---

C
cuicheng01 已提交
7 8
## 目录

S
sibo2rr 已提交
9 10 11 12
- [1. 安装 paddleclas](#1)
- [2. 快速开始](#2)
- [3. 参数解释](#3)
- [4. 使用示例](#4)
C
cuicheng01 已提交
13
   - [4.1 查看帮助信息](#4.1)
S
sibo2rr 已提交
14
   - [4.2 使用 PaddleClas 提供的预训练模型进行预测](#4.2)
C
cuicheng01 已提交
15 16 17
   - [4.3 使用本地模型文件预测](#4.3)
   - [4.4 批量预测](#4.4)
   - [4.5 对网络图片进行预测](#4.5)
18
   - [4.6 对 `NumPy.ndarray` 格式数据进行预测](#4.6)
C
cuicheng01 已提交
19
   - [4.7 保存预测结果](#4.7)
S
sibo2rr 已提交
20
   - [4.8 指定 label name](#4.8)
G
gaotingquan 已提交
21

S
sibo2rr 已提交
22

C
cuicheng01 已提交
23
<a name="1"></a>
S
sibo2rr 已提交
24
## 1. 安装 paddleclas
25

G
gaotingquan 已提交
26
* **[推荐]** 直接 pip 安装:
27 28

```bash
G
gaotingquan 已提交
29
pip3 install paddleclas
30 31
```

G
gaotingquan 已提交
32
* 如需使用 PaddleClas develop 分支体验最新功能,或是需要基于 PaddleClas 进行二次开发,请本地构建安装:
33 34

```bash
G
gaotingquan 已提交
35
python3 setup.py install
36 37
```

C
cuicheng01 已提交
38
<a name="2"></a>
S
sibo2rr 已提交
39
## 2. 快速开始
40
* 使用 `ResNet50` 模型,以下图(`PaddleClas/docs/images/inference_deployment/whl_demo.jpg`)为例进行说明。
41

S
sibo2rr 已提交
42
![](../../images/inference_deployment/whl_demo.jpg)
43 44


S
sibo2rr 已提交
45
* 在 Python 代码中使用
46 47 48
```python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50')
G
gaotingquan 已提交
49
infer_imgs='docs/images/inference_deployment/whl_demo.jpg'
50 51 52 53 54 55 56 57 58 59 60 61 62
result=clas.predict(infer_imgs)
print(next(result))
```

**注意**`PaddleClas.predict()` 为可迭代对象(`generator`),因此需要使用 `next()` 函数或 `for` 循环对其迭代调用。每次调用将以 `batch_size` 为单位进行一次预测,并返回预测结果。返回结果示例如下:

```
>>> result
[{'class_ids': [8, 7, 136, 80, 84], 'scores': [0.79368, 0.16329, 0.01853, 0.00959, 0.00239], 'label_names': ['hen', 'cock', 'European gallinule, Porphyrio porphyrio', 'black grouse', 'peacock']}]
```

* 在命令行中使用
```bash
G
gaotingquan 已提交
63
paddleclas --model_name=ResNet50  --infer_imgs="docs/images/inference_deployment/whl_demo.jpg"
64 65 66 67
```

```
>>> result
G
gaotingquan 已提交
68
filename: docs/images/inference_deployment/whl_demo.jpg, top-5, class_ids: [8, 7, 136, 80, 84], scores: [0.79368, 0.16329, 0.01853, 0.00959, 0.00239], label_names: ['hen', 'cock', 'European gallinule, Porphyrio porphyrio', 'black grouse', 'peacock']
69 70 71
Predict complete!
```

C
cuicheng01 已提交
72
<a name="3"></a>
S
sibo2rr 已提交
73 74 75
## 3. 参数解释
以下参数可在命令行方式使用中通过参数指定,或在 Python 代码中实例化 PaddleClas 对象时作为构造函数的参数使用。
* model_name(str): 模型名称,使用 PaddleClas 提供的基于 ImageNet1k 的预训练模型。
76
* inference_model_dir(str): 本地模型文件目录,当未指定 `model_name` 时该参数有效。该目录下需包含 `inference.pdmodel``inference.pdiparams` 两个模型文件。
S
sibo2rr 已提交
77 78 79 80 81 82 83
* infer_imgs(str): 待预测图片文件路径,或包含图片文件的目录,或网络图片的 URL。
* use_gpu(bool): 是否使用 GPU,默认为 `True`
* gpu_mem(int): 使用的 GPU 显存大小,当 `use_gpu``True` 时有效,默认为 8000。
* use_tensorrt(bool): 是否开启 TensorRT 预测,可提升 GPU 预测性能,需要使用带 TensorRT 的预测库,默认为 `False`
* enable_mkldnn(bool): 是否开启 MKLDNN,当 `use_gpu``False` 时有效,默认 `False`
* cpu_num_threads(int): CPU 预测时的线程数,当 `use_gpu``False``enable_mkldnn``True` 时有效,默认值为 `10`
* batch_size(int): 预测时每个 batch 的样本数量,默认为 `1`
84 85 86 87 88 89
* resize_short(int): 按图像较短边进行等比例缩放,默认为 `256`
* crop_size(int): 将图像裁剪到指定大小,默认为 `224`
* topk(int): 打印(返回)预测结果的前 `topk` 个类别和对应的分类概率,默认为 `5`
* class_id_map_file(str): `class id``label` 的映射关系文件。默认使用 `ImageNet1K` 数据集的映射关系。
* save_dir(str): 将预测结果作为预标注数据保存的路径,默认为 `None`,即不保存。

90
**注意**: 如果使用 `Transformer` 系列模型,如 `DeiT_***_384`, `ViT_***_384` 等,请注意模型的输入数据尺寸,需要设置参数 `resize_short=384`, `crop_size=384`,如下所示。
91 92 93

* 命令行中
```bash
G
gaotingquan 已提交
94
paddleclas --model_name=ViT_base_patch16_384 --infer_imgs='docs/images/inference_deployment/whl_demo.jpg' --resize_short=384 --crop_size=384
95 96
```

S
sibo2rr 已提交
97
* Python 代码中
98 99 100 101 102
```python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ViT_base_patch16_384', resize_short=384, crop_size=384)
```

C
cuicheng01 已提交
103
<a name="4"></a>
S
sibo2rr 已提交
104
## 4. 使用示例
105

S
sibo2rr 已提交
106 107
PaddleClas 提供两种使用方式:
1. Python 代码中使用;
108 109
2. 命令行中使用。

C
cuicheng01 已提交
110
<a name="4.1"></a>
111 112 113 114 115 116 117
### 4.1 查看帮助信息

* CLI
```bash
paddleclas -h
```

C
cuicheng01 已提交
118
<a name="4.2"></a>
S
sibo2rr 已提交
119
### 4.2 使用 PaddleClas 提供的预训练模型进行预测
120
可以使用 PaddleClas 提供的预训练模型来预测,并通过参数 `model_name` 指定。此时 PaddleClas 会根据 `model_name` 自动下载指定模型,并保存在目录`~/.paddleclas/`下。
121 122 123 124 125

* Python
```python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50')
G
gaotingquan 已提交
126
infer_imgs = 'docs/images/inference_deployment/whl_demo.jpg'
127 128 129 130 131 132
result=clas.predict(infer_imgs)
print(next(result))
```

* CLI
```bash
G
gaotingquan 已提交
133
paddleclas --model_name='ResNet50' --infer_imgs='docs/images/inference_deployment/whl_demo.jpg'
134 135
```

C
cuicheng01 已提交
136
<a name="4.3"></a>
137
### 4.3 使用本地模型文件预测
138
可以使用本地的模型文件进行预测,通过参数 `inference_model_dir` 指定模型文件目录即可。需要注意,模型文件目录下必须包含 `inference.pdmodel``inference.pdiparams` 两个文件。
139 140 141 142 143

* Python
```python
from paddleclas import PaddleClas
clas = PaddleClas(inference_model_dir='./inference/')
G
gaotingquan 已提交
144
infer_imgs = 'docs/images/inference_deployment/whl_demo.jpg'
145 146 147 148 149 150
result=clas.predict(infer_imgs)
print(next(result))
```

* CLI
```bash
G
gaotingquan 已提交
151
paddleclas --inference_model_dir='./inference/' --infer_imgs='docs/images/inference_deployment/whl_demo.jpg'
152 153
```

C
cuicheng01 已提交
154
<a name="4.4"></a>
155
### 4.4 批量预测
S
sibo2rr 已提交
156
当参数 `infer_imgs` 为包含图片文件的目录时,可以对图片进行批量预测,只需通过参数 `batch_size` 指定 batch 大小。
157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172

* Python
```python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50', batch_size=2)
infer_imgs = 'docs/images/'
result=clas.predict(infer_imgs)
for r in result:
    print(r)
```

* CLI
```bash
paddleclas --model_name='ResNet50' --infer_imgs='docs/images/' --batch_size 2
```

C
cuicheng01 已提交
173
<a name="4.5"></a>
174
### 4.5 对网络图片进行预测
175
可以对网络图片进行预测,只需通过参数 `infer_imgs` 指定图片 `url`。此时图片会下载并保存在`~/.paddleclas/images/`目录下。
176 177 178 179 180

* Python
```python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50')
G
gaotingquan 已提交
181
infer_imgs = 'https://raw.githubusercontent.com/paddlepaddle/paddleclas/release/2.2/docs/images/inference_deployment/whl_demo.jpg'
182 183 184 185 186 187
result=clas.predict(infer_imgs)
print(next(result))
```

* CLI
```bash
G
gaotingquan 已提交
188
paddleclas --model_name='ResNet50' --infer_imgs='https://raw.githubusercontent.com/paddlepaddle/paddleclas/release/2.2/docs/images/inference_deployment/whl_demo.jpg'
189 190
```

C
cuicheng01 已提交
191
<a name="4.6"></a>
192
### 4.6 对 `NumPy.ndarray` 格式数据进行预测
T
Tingquan Gao 已提交
193
在 Python 中,可以对 `Numpy.ndarray` 格式的图像数据进行预测,只需通过参数 `infer_imgs` 指定即可。注意,PaddleClas 所提供的模型仅支持 3 通道图像数据,且通道顺序为 `RGB`
194 195 196 197 198 199

* python
```python
import cv2
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50')
T
Tingquan Gao 已提交
200
infer_imgs = cv2.imread("docs/images/inference_deployment/whl_demo.jpg")[:, :, ::-1]
201 202 203 204
result=clas.predict(infer_imgs)
print(next(result))
```

C
cuicheng01 已提交
205
<a name="4.7"></a>
206
### 4.7 保存预测结果
207
可以指定参数 `pre_label_out_dir='./output_pre_label/'`,将图片按其 top1 预测结果保存到 `pre_label_out_dir` 目录下对应类别的文件夹中。
208 209 210 211 212

* python
```python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50', save_dir='./output_pre_label/')
G
gaotingquan 已提交
213
infer_imgs = 'docs/images/' # it can be infer_imgs folder path which contains all of images you want to predict.
214 215 216 217 218 219
result=clas.predict(infer_imgs)
print(next(result))
```

* CLI
```bash
G
gaotingquan 已提交
220
paddleclas --model_name='ResNet50' --infer_imgs='docs/images/' --save_dir='./output_pre_label/'
221 222
```

C
cuicheng01 已提交
223
<a name="4.8"></a>
S
sibo2rr 已提交
224
### 4.8 指定 label name
225
可以通过参数 `class_id_map_file` 指定 `class id``lable` 的对应关系。PaddleClas 默认使用 ImageNet1K 的 label_name(`ppcls/utils/imagenet1k_label_list.txt`)。
226

227
`class_id_map_file` 文件内容格式应为:
228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245

```
class_id<space>class_name<\n>
```

例如:

```
0 tench, Tinca tinca
1 goldfish, Carassius auratus
2 great white shark, white shark, man-eater, man-eating shark, Carcharodon carcharias
......
```

* Python
```python
from paddleclas import PaddleClas
clas = PaddleClas(model_name='ResNet50', class_id_map_file='./ppcls/utils/imagenet1k_label_list.txt')
G
gaotingquan 已提交
246
infer_imgs = 'docs/images/inference_deployment/whl_demo.jpg'
247 248 249 250 251 252
result=clas.predict(infer_imgs)
print(next(result))
```

* CLI
```bash
G
gaotingquan 已提交
253
paddleclas --model_name='ResNet50' --infer_imgs='docs/images/inference_deployment/whl_demo.jpg' --class_id_map_file='./ppcls/utils/imagenet1k_label_list.txt'
254
```