quick_start_recognition.md 23.0 KB
Newer Older
littletomatodonkey's avatar
littletomatodonkey 已提交
1 2
# 图像识别快速开始

H
HydrogenSulfate 已提交
3
本文档包含 2 个部分:PP-ShiTu android端 demo 快速体验与PP-ShiTu PC端 demo 快速体验。
littletomatodonkey's avatar
littletomatodonkey 已提交
4 5 6 7 8

如果图像类别已经存在于图像索引库中,那么可以直接参考[图像识别体验](#图像识别体验)章节,完成图像识别过程;如果希望识别未知类别的图像,即图像类别之前不存在于索引库中,那么可以参考[未知类别的图像识别体验](#未知类别的图像识别体验)章节,完成建立索引并识别的过程。

## 目录

H
HydrogenSulfate 已提交
9 10 11
- [1. PP-ShiTu android端 demo 快速体验](#1-pp-shitu-android端-demo-快速体验)
  - [1.1 安装 PP-ShiTu android demo](#11-安装-pp-shitu-android-demo)
  - [1.2 功能体验](#12-功能体验)
H
HydrogenSulfate 已提交
12 13 14 15 16
    - [1.2.1 图像检索](#121-图像检索)
    - [1.2.2 图像加库](#122-图像加库)
    - [1.2.3 库保存](#123-库保存)
    - [1.2.4 更换检索库](#124-更换检索库)
    - [1.2.5 查看检索库标签](#125-查看检索库标签)
H
HydrogenSulfate 已提交
17
  - [1.3 功能详细介绍](#13-功能详细介绍)
H
HydrogenSulfate 已提交
18 19 20 21 22
    - [1.3.1 图像检索](#131-图像检索)
    - [1.3.2 图像加库](#132-图像加库)
    - [1.3.3 库保存](#133-库保存)
    - [1.3.4 更换检索库](#134-更换检索库)
    - [1.3.5 查看检索库的标签](#135-查看检索库的标签)
H
HydrogenSulfate 已提交
23 24 25 26 27
- [2. PP-ShiTu PC端 demo 快速体验](#2-pp-shitu-pc端-demo-快速体验)
  - [2.1 环境配置](#21-环境配置)
  - [2.2 图像识别体验](#22-图像识别体验)
    - [2.2.1 下载、解压 inference 模型与 demo 数据](#221-下载解压-inference-模型与-demo-数据)
    - [2.2.2 瓶装饮料识别与检索](#222-瓶装饮料识别与检索)
H
HydrogenSulfate 已提交
28 29
      - [2.2.2.1 识别单张图像](#2221-识别单张图像)
      - [2.2.2.2 基于文件夹的批量识别](#2222-基于文件夹的批量识别)
H
HydrogenSulfate 已提交
30 31 32 33
  - [2.3 未知类别的图像识别体验](#23-未知类别的图像识别体验)
    - [2.3.1 准备新的数据与标签](#231-准备新的数据与标签)
    - [2.3.2 建立新的索引库](#232-建立新的索引库)
    - [2.3.3 基于新的索引库的图像识别](#233-基于新的索引库的图像识别)
H
HydrogenSulfate 已提交
34
  - [2.4 服务端识别模型列表](#24-服务端识别模型列表)
H
HydrogenSulfate 已提交
35

H
HydrogenSulfate 已提交
36
<a name="PP-ShiTu android端 快速体验"></a>
H
HydrogenSulfate 已提交
37 38

## 1. PP-ShiTu android端 demo 快速体验
littletomatodonkey's avatar
littletomatodonkey 已提交
39

H
HydrogenSulfate 已提交
40 41
<a name="安装"></a>

H
HydrogenSulfate 已提交
42
### 1.1 安装 PP-ShiTu android demo
S
sibo2rr 已提交
43

H
HydrogenSulfate 已提交
44
可以通过扫描二维码或者[点击链接](https://paddle-imagenet-models-name.bj.bcebos.com/demos/PP-ShiTu.apk)下载并安装APP
45

H
HydrogenSulfate 已提交
46
**注:** 华为鸿蒙OS 3.0的系统可能会出现无法调用摄像头的情况,建议更换低版本系统或者使用其它安卓机型进行快速体验。
47

D
dongshuilong 已提交
48
<div align=center><img src="../../images/quick_start/android_demo/PPShiTu_qrcode.png" height="400" width="400"/></div>
H
HydrogenSulfate 已提交
49 50

<a name="功能体验"></a>
H
HydrogenSulfate 已提交
51

H
HydrogenSulfate 已提交
52 53 54
### 1.2 功能体验
目前 PP-ShiTu android demo 具有图像检索、图像加库、库保存、更换检索库、查看检索库内的标签等基本功能,接下来介绍如何体验这几个功能。

H
HydrogenSulfate 已提交
55 56 57 58 59
#### 1.2.1 图像检索
点击下方的“拍照识别”按钮<img src="../../images/quick_start/android_demo/paizhaoshibie_100.png" width="25" height="25"/>或者“本地识别”按钮<img src="../../images/quick_start/android_demo/bendishibie_100.png" width="25" height="25"/>,即可拍摄一张图像或者选中一张图像,然后等待几秒钟,APP便会将图像中的主体框标注出来并且在图像下方给出预测的类别以及预测时间等信息。

假设待检索的图像如下:

H
HydrogenSulfate 已提交
60
<img src="../../images/recognition/drink_data_demo/test_images/100.jpeg" width="400" height="600"/>
H
HydrogenSulfate 已提交
61 62

得到的检索结果可视化如下:
63

H
HydrogenSulfate 已提交
64
<img src="../../images/quick_start/android_demo/android_nongfu_spring.JPG" width="400" height="800"/>
65

H
HydrogenSulfate 已提交
66
#### 1.2.2 图像加库
H
HydrogenSulfate 已提交
67
点击上方的“拍照上传”按钮<img src="../../images/quick_start/android_demo/paizhaoshangchuan_100.png" width="25" height="25"/>或者“本地上传”按钮<img src="../../images/quick_start/android_demo/bendishangchuan_100.png" width="25" height="25"/>,即可拍摄一张图像或从图库中选择一张图像,然后再输入这张图像的类别名字(比如`keyboard`),点击“确定”按钮,即可将图片对应的特征向量与标签加入检索库。
68

H
HydrogenSulfate 已提交
69
#### 1.2.3 库保存
H
HydrogenSulfate 已提交
70
点击上方的“保存修改”按钮<img src="../../images/quick_start/android_demo/baocunxiugai_100.png" width="25" height="25"/>,即可将当前库以 `latest` 的库名保存下来,保存完毕之后也会自动将当前程序中的库覆盖为 `latest`
71

H
HydrogenSulfate 已提交
72 73
#### 1.2.4 初始化检索库
点击上方的“初始化 ”按钮<img src="../../images/quick_start/android_demo/reset.png" width="25" height="25"/>,即可将当前库初始化为 `original`(注意这一操作会自动删除 `latest` 库)。
74

H
HydrogenSulfate 已提交
75
#### 1.2.5 查看检索库标签
H
HydrogenSulfate 已提交
76
点击“类别查询”按钮<img src="../../images/quick_start/android_demo/leibiechaxun_100.png" width="25" height="25"/>,即可在弹窗中查看。
H
HydrogenSulfate 已提交
77 78

<a name="功能介绍"></a>
H
HydrogenSulfate 已提交
79

H
HydrogenSulfate 已提交
80 81
### 1.3 功能详细介绍

H
HydrogenSulfate 已提交
82 83 84 85 86 87 88 89 90
#### 1.3.1 图像检索
在选择好要检索的图片之后,首先会通过检测模型进行主体检测,得到图像中的物体的区域,然后将这块区域裁剪出来输入到识别模型中,得到对应的特征向量并在检索库中检索,返回并显示最终的检索结果。

#### 1.3.2 图像加库
在选择好要入库的图片之后,首先会通过检测模型进行主体检测,得到图像中的物体的区域,然后将这块区域裁剪出来输入到识别模型中,得到对应的特征向量,再与用户输入的图像标签一起加入到检索库中。

#### 1.3.3 库保存
此功能只需输入希望保存的文件名即可,如输入`database_1`,则会将检索向量库保存为`database_1.index`,检索标签库保存为`database_1.txt`

H
HydrogenSulfate 已提交
91 92
#### 1.3.4 初始化检索库
初始化库时会自动将检索库和标签库切换成 `original.index``original.txt`,并删除手机中的 `latest.index``latest.txt`
H
HydrogenSulfate 已提交
93 94

#### 1.3.5 查看检索库的标签
H
HydrogenSulfate 已提交
95
可按照[功能体验-查看检索库的标签](#125-查看检索库标签)中说明进行查看,当检索标签库过多(如本demo自带的196类检索标签库)时,可在弹窗中滑动查看。
H
HydrogenSulfate 已提交
96 97 98


## 2. PP-ShiTu PC端 demo 快速体验
H
HydrogenSulfate 已提交
99 100 101

<a name="环境配置"></a>

H
HydrogenSulfate 已提交
102
### 2.1 环境配置
littletomatodonkey's avatar
littletomatodonkey 已提交
103

W
weishengyu 已提交
104
* 安装:请先参考文档 [环境准备](../installation/install_paddleclas.md) 配置 PaddleClas 运行环境。
littletomatodonkey's avatar
littletomatodonkey 已提交
105 106 107

* 进入 `deploy` 运行目录。本部分所有内容与命令均需要在 `deploy` 目录下运行,可以通过下面的命令进入 `deploy` 目录。

H
HydrogenSulfate 已提交
108
  ```shell
littletomatodonkey's avatar
littletomatodonkey 已提交
109 110 111 112
  cd deploy
  ```

<a name="图像识别体验"></a>
S
sibo2rr 已提交
113

H
HydrogenSulfate 已提交
114
### 2.2 图像识别体验
littletomatodonkey's avatar
littletomatodonkey 已提交
115

littletomatodonkey's avatar
littletomatodonkey 已提交
116
轻量级通用主体检测模型与轻量级通用识别模型和配置文件下载方式如下表所示。
littletomatodonkey's avatar
littletomatodonkey 已提交
117

118 119
<a name="轻量级通用主体检测模型与轻量级通用识别模型"></a>

H
HydrogenSulfate 已提交
120 121 122 123
| 模型简介               | 推荐场景 | inference 模型                                                                                                                                                                                                                                                                                                                    | 预测配置文件                                                             |
| ---------------------- | -------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------ |
| 轻量级通用主体检测模型 | 通用场景 | [tar 格式下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/picodet_PPLCNet_x2_5_mainbody_lite_v1.0_infer.tar) [zip 格式文件下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/picodet_PPLCNet_x2_5_mainbody_lite_v1.0_infer.zip)                     | -                                                                        |
| 轻量级通用识别模型     | 通用场景 | [tar 格式下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/PP-ShiTuV2/general_PPLCNetV2_base_pretrained_v1.0_infer.tar) [zip 格式文件下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/PP-ShiTuV2/general_PPLCNetV2_base_pretrained_v1.0_infer.zip) | [inference_general.yaml](../../../deploy/configs/inference_general.yaml) |
G
gaotingquan 已提交
124

H
HydrogenSulfate 已提交
125
注意:由于部分解压缩软件在解压上述 `tar` 格式文件时存在问题,建议非命令行用户下载 `zip` 格式文件并解压。`tar` 格式文件建议使用命令 `tar -xf xxx.tar` 解压。
littletomatodonkey's avatar
littletomatodonkey 已提交
126

H
HydrogenSulfate 已提交
127
本章节 demo 数据下载地址如下: [瓶装饮料数据下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/data/drink_dataset_v2.0.tar)
littletomatodonkey's avatar
littletomatodonkey 已提交
128

H
HydrogenSulfate 已提交
129
如果希望体验服务端主体检测和各垂类方向的识别模型,可以参考[2.4 服务端识别模型列表](#24-服务端识别模型列表)
littletomatodonkey's avatar
littletomatodonkey 已提交
130

littletomatodonkey's avatar
littletomatodonkey 已提交
131 132
**注意**

133
1. windows 环境下如果没有安装 wget, 可以按照下面的步骤安装 wget 与 tar 命令,也可以在下载模型时将链接复制到浏览器中下载,并解压放置在相应目录下; linux 或者 macOS 用户可以右键点击,然后复制下载链接,即可通过 `wget` 命令下载。
littletomatodonkey's avatar
littletomatodonkey 已提交
134 135 136 137 138
2. 如果 macOS 环境下没有安装 `wget` 命令,可以运行下面的命令进行安装。

```shell
# 安装 homebrew
ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)";
S
sibo2rr 已提交
139
# 安装 wget
littletomatodonkey's avatar
littletomatodonkey 已提交
140 141 142
brew install wget
```

143
4. 如果希望在 windows 环境下安装 wget,可以参考:[链接](https://www.cnblogs.com/jeshy/p/10518062.html);如果希望在 windows 环境中安装 tar 命令,可以参考:[链接](https://www.cnblogs.com/chooperman/p/14190107.html)
littletomatodonkey's avatar
littletomatodonkey 已提交
144 145 146 147 148 149 150


* 可以按照下面的命令下载并解压数据与模型

```shell
mkdir models
cd models
S
sibo2rr 已提交
151
# 下载识别 inference 模型并解压
littletomatodonkey's avatar
littletomatodonkey 已提交
152 153 154
wget {模型下载链接地址} && tar -xf {压缩包的名称}
cd ..

S
sibo2rr 已提交
155
# 下载 demo 数据并解压
littletomatodonkey's avatar
littletomatodonkey 已提交
156 157 158
wget {数据下载链接地址} && tar -xf {压缩包的名称}
```

H
HydrogenSulfate 已提交
159
<a name="2.2.1"></a>
G
gaotingquan 已提交
160

H
HydrogenSulfate 已提交
161
#### 2.2.1 下载、解压 inference 模型与 demo 数据
littletomatodonkey's avatar
littletomatodonkey 已提交
162

littletomatodonkey's avatar
littletomatodonkey 已提交
163
下载 demo 数据集以及轻量级主体检测、识别模型,命令如下。
littletomatodonkey's avatar
littletomatodonkey 已提交
164 165 166 167 168

```shell
mkdir models
cd models
# 下载通用检测 inference 模型并解压
littletomatodonkey's avatar
littletomatodonkey 已提交
169
wget https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/picodet_PPLCNet_x2_5_mainbody_lite_v1.0_infer.tar && tar -xf picodet_PPLCNet_x2_5_mainbody_lite_v1.0_infer.tar
littletomatodonkey's avatar
littletomatodonkey 已提交
170
# 下载识别 inference 模型并解压
H
HydrogenSulfate 已提交
171
wget https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/PP-ShiTuV2/general_PPLCNetV2_base_pretrained_v1.0_infer.tar && tar -xf general_PPLCNetV2_base_pretrained_v1.0_infer.tar
littletomatodonkey's avatar
littletomatodonkey 已提交
172 173 174

cd ../
# 下载 demo 数据并解压
H
HydrogenSulfate 已提交
175
wget https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/data/drink_dataset_v2.0.tar && tar -xf drink_dataset_v2.0.tar
littletomatodonkey's avatar
littletomatodonkey 已提交
176 177
```

H
HydrogenSulfate 已提交
178
解压完毕后,`drink_dataset_v2.0/` 文件夹下应有如下文件结构:
littletomatodonkey's avatar
littletomatodonkey 已提交
179

H
HydrogenSulfate 已提交
180
```log
H
HydrogenSulfate 已提交
181
├── drink_dataset_v2.0/
littletomatodonkey's avatar
littletomatodonkey 已提交
182 183 184
│   ├── gallery/
│   ├── index/
│   ├── test_images/
littletomatodonkey's avatar
littletomatodonkey 已提交
185 186 187
├── ...
```

188
其中 `gallery` 文件夹中存放的是用于构建索引库的原始图像,`index` 表示基于原始图像构建得到的索引库信息,`test_images` 文件夹中存放的是用于测试识别效果的图像列表。
littletomatodonkey's avatar
littletomatodonkey 已提交
189 190 191 192


`models` 文件夹下应有如下文件结构:

H
HydrogenSulfate 已提交
193
```log
H
HydrogenSulfate 已提交
194
├── general_PPLCNetV2_base_pretrained_v1.0_infer
littletomatodonkey's avatar
littletomatodonkey 已提交
195 196 197
│   ├── inference.pdiparams
│   ├── inference.pdiparams.info
│   └── inference.pdmodel
littletomatodonkey's avatar
littletomatodonkey 已提交
198
├── picodet_PPLCNet_x2_5_mainbody_lite_v1.0_infer
littletomatodonkey's avatar
littletomatodonkey 已提交
199 200 201 202 203 204 205
│   ├── inference.pdiparams
│   ├── inference.pdiparams.info
│   └── inference.pdmodel
```

**注意**

206
如果使用服务端通用识别模型,Demo 数据需要重新提取特征、够建索引,方式如下:
littletomatodonkey's avatar
littletomatodonkey 已提交
207 208

```shell
littletomatodonkey's avatar
littletomatodonkey 已提交
209
# 下面是使用下载的服务端商品识别模型进行索引库构建
H
HydrogenSulfate 已提交
210
python3.7 python/build_gallery.py -c configs/inference_general.yaml -o Global.rec_inference_model_dir=./models/general_PPLCNetV2_base_pretrained_v1.0_infer
littletomatodonkey's avatar
littletomatodonkey 已提交
211 212
```

littletomatodonkey's avatar
littletomatodonkey 已提交
213
<a name="瓶装饮料识别与检索"></a>
214

H
HydrogenSulfate 已提交
215
#### 2.2.2 瓶装饮料识别与检索
littletomatodonkey's avatar
littletomatodonkey 已提交
216

littletomatodonkey's avatar
littletomatodonkey 已提交
217
以瓶装饮料识别 demo 为例,展示识别与检索过程(如果希望尝试其他方向的识别与检索效果,在下载解压好对应的 demo 数据与模型之后,替换对应的配置文件即可完成预测)。
littletomatodonkey's avatar
littletomatodonkey 已提交
218 219 220 221

注意,此部分使用了 `faiss` 作为检索库,安装方法如下:

```python
H
HydrogenSulfate 已提交
222
python3.7 -m pip install faiss-cpu==1.7.1post2
littletomatodonkey's avatar
littletomatodonkey 已提交
223 224
```

225
若使用时,不能正常引用,则 `uninstall` 之后,重新 `install`,尤其是 windows 下。
littletomatodonkey's avatar
littletomatodonkey 已提交
226 227 228

<a name="识别单张图像"></a>

H
HydrogenSulfate 已提交
229
##### 2.2.2.1 识别单张图像
littletomatodonkey's avatar
littletomatodonkey 已提交
230

H
HydrogenSulfate 已提交
231
运行下面的命令,对图像 `./drink_dataset_v2.0/test_images/100.jpeg` 进行识别与检索
littletomatodonkey's avatar
littletomatodonkey 已提交
232 233

```shell
S
sibo2rr 已提交
234
# 使用下面的命令使用 GPU 进行预测
littletomatodonkey's avatar
littletomatodonkey 已提交
235
python3.7 python/predict_system.py -c configs/inference_general.yaml
S
sibo2rr 已提交
236
# 使用下面的命令使用 CPU 进行预测
littletomatodonkey's avatar
littletomatodonkey 已提交
237
python3.7 python/predict_system.py -c configs/inference_general.yaml -o Global.use_gpu=False
littletomatodonkey's avatar
littletomatodonkey 已提交
238 239 240 241
```

待检索图像如下所示。

H
HydrogenSulfate 已提交
242
![](../../images/recognition/drink_data_demo/test_images/100.jpeg)
littletomatodonkey's avatar
littletomatodonkey 已提交
243 244 245 246


最终输出结果如下。

H
HydrogenSulfate 已提交
247
```log
H
HydrogenSulfate 已提交
248
[{'bbox': [437, 71, 660, 728], 'rec_docs': '元气森林', 'rec_scores': 0.7740249}, {'bbox': [221, 72, 449, 701], 'rec_docs': '元气森林', 'rec_scores': 0.6950992}, {'bbox': [794, 104, 979, 652], 'rec_docs': '元气森林', 'rec_scores': 0.6305153}]
littletomatodonkey's avatar
littletomatodonkey 已提交
249 250
```

251
其中 `bbox` 表示检测出的主体所在位置,`rec_docs` 表示索引库中与检测框最为相似的类别,`rec_scores` 表示对应的置信度。
littletomatodonkey's avatar
littletomatodonkey 已提交
252

253
检测的可视化结果也保存在 `output` 文件夹下,对于本张图像,识别结果可视化如下所示。
littletomatodonkey's avatar
littletomatodonkey 已提交
254

H
HydrogenSulfate 已提交
255
![](../../images/recognition/drink_data_demo/output/100.jpeg)
littletomatodonkey's avatar
littletomatodonkey 已提交
256 257 258


<a name="基于文件夹的批量识别"></a>
H
HydrogenSulfate 已提交
259 260

##### 2.2.2.2 基于文件夹的批量识别
littletomatodonkey's avatar
littletomatodonkey 已提交
261 262 263 264

如果希望预测文件夹内的图像,可以直接修改配置文件中的 `Global.infer_imgs` 字段,也可以通过下面的 `-o` 参数修改对应的配置。

```shell
S
sibo2rr 已提交
265
# 使用下面的命令使用 GPU 进行预测,如果希望使用 CPU 预测,可以在命令后面添加 -o Global.use_gpu=False
H
HydrogenSulfate 已提交
266
python3.7 python/predict_system.py -c configs/inference_general.yaml -o Global.infer_imgs="./drink_dataset_v2.0/test_images/"
littletomatodonkey's avatar
littletomatodonkey 已提交
267 268 269 270
```

终端中会输出该文件夹内所有图像的识别结果,如下所示。

H
HydrogenSulfate 已提交
271
```log
littletomatodonkey's avatar
littletomatodonkey 已提交
272
...
H
HydrogenSulfate 已提交
273 274 275 276 277 278 279 280 281 282 283
[{'bbox': [0, 0, 600, 600], 'rec_docs': '红牛-强化型', 'rec_scores': 0.74081033}]
Inference: 120.39852142333984 ms per batch image
[{'bbox': [0, 0, 514, 436], 'rec_docs': '康师傅矿物质水', 'rec_scores': 0.6918598}]
Inference: 32.045602798461914 ms per batch image
[{'bbox': [138, 40, 573, 1198], 'rec_docs': '乐虎功能饮料', 'rec_scores': 0.68214047}]
Inference: 113.41428756713867 ms per batch image
[{'bbox': [328, 7, 467, 272], 'rec_docs': '脉动', 'rec_scores': 0.60406065}]
Inference: 122.04337120056152 ms per batch image
[{'bbox': [242, 82, 498, 726], 'rec_docs': '味全_每日C', 'rec_scores': 0.5428652}]
Inference: 37.95266151428223 ms per batch image
[{'bbox': [437, 71, 660, 728], 'rec_docs': '元气森林', 'rec_scores': 0.7740249}, {'bbox': [221, 72, 449, 701], 'rec_docs': '元气森林', 'rec_scores': 0.6950992}, {'bbox': [794, 104, 979, 652], 'rec_docs': '元气森林', 'rec_scores': 0.6305153}]
littletomatodonkey's avatar
littletomatodonkey 已提交
284 285 286
...
```

287
所有图像的识别结果可视化图像也保存在 `output` 文件夹内。
littletomatodonkey's avatar
littletomatodonkey 已提交
288 289 290 291 292

更多地,可以通过修改 `Global.rec_inference_model_dir` 字段来更改识别 inference 模型的路径,通过修改 `IndexProcess.index_dir` 字段来更改索引库索引的路径。

<a name="未知类别的图像识别体验"></a>

H
HydrogenSulfate 已提交
293
### 2.3 未知类别的图像识别体验
littletomatodonkey's avatar
littletomatodonkey 已提交
294

H
HydrogenSulfate 已提交
295
对图像 `./drink_dataset_v2.0/test_images/mosilian.jpeg` 进行识别,命令如下
littletomatodonkey's avatar
littletomatodonkey 已提交
296 297 298

```shell
# 使用下面的命令使用 GPU 进行预测,如果希望使用 CPU 预测,可以在命令后面添加 -o Global.use_gpu=False
H
HydrogenSulfate 已提交
299
python3.7 python/predict_system.py -c configs/inference_general.yaml -o Global.infer_imgs="./drink_dataset_v2.0/test_images/mosilian.jpeg"
littletomatodonkey's avatar
littletomatodonkey 已提交
300 301 302 303
```

待检索图像如下所示。

S
sibo2rr 已提交
304
![](../../images/recognition/drink_data_demo/test_images/mosilian.jpeg)
littletomatodonkey's avatar
littletomatodonkey 已提交
305 306 307 308 309 310 311 312 313


输出结果为空。

由于默认的索引库中不包含对应的索引信息,所以这里的识别结果有误,此时我们可以通过构建新的索引库的方式,完成未知类别的图像识别。

当索引库中的图像无法覆盖我们实际识别的场景时,即在预测未知类别的图像时,我们需要将对应类别的相似图像添加到索引库中,从而完成对未知类别的图像识别,这一过程是不需要重新训练的。

<a name="准备新的数据与标签"></a>
S
sibo2rr 已提交
314

H
HydrogenSulfate 已提交
315
#### 2.3.1 准备新的数据与标签
littletomatodonkey's avatar
littletomatodonkey 已提交
316

H
HydrogenSulfate 已提交
317
首先需要将与待检索图像相似的图像列表拷贝到索引库原始图像的文件夹。这里 PaddleClas 已经将所有的图像数据都放在文件夹 `drink_dataset_v2.0/gallery/` 中。
littletomatodonkey's avatar
littletomatodonkey 已提交
318

H
HydrogenSulfate 已提交
319
然后需要编辑记录了图像路径和标签信息的文本文件,这里 PaddleClas 将更正后的标签信息文件放在了 `drink_dataset_v2.0/gallery/drink_label_all.txt` 文件中。可以与默认的 `drink_dataset_v2.0/gallery/drink_label.txt` 标签文件进行对比,添加了光明和三元系列牛奶的索引图像。
littletomatodonkey's avatar
littletomatodonkey 已提交
320

321
每一行的文本中,第一个字段表示图像的相对路径,第二个字段表示图像对应的标签信息,中间用 `\t` 键分隔开(注意:有些编辑器会将 `tab` 自动转换为 `空格`,这种情况下会导致文件解析报错)。
littletomatodonkey's avatar
littletomatodonkey 已提交
322 323

<a name="建立新的索引库"></a>
S
sibo2rr 已提交
324

H
HydrogenSulfate 已提交
325
#### 2.3.2 建立新的索引库
littletomatodonkey's avatar
littletomatodonkey 已提交
326 327 328 329

使用下面的命令构建 `index` 索引,加速识别后的检索过程。

```shell
H
HydrogenSulfate 已提交
330
python3.7 python/build_gallery.py -c configs/inference_general.yaml -o IndexProcess.data_file="./drink_dataset_v2.0/gallery/drink_label_all.txt" -o IndexProcess.index_dir="./drink_dataset_v2.0/index_all"
littletomatodonkey's avatar
littletomatodonkey 已提交
331 332
```

H
HydrogenSulfate 已提交
333
最终新的索引信息保存在文件夹 `./drink_dataset_v2.0/index_all` 中。具体 `yaml` 请参考[向量检索文档](../image_recognition_pipeline/vector_search.md)
littletomatodonkey's avatar
littletomatodonkey 已提交
334 335 336

<a name="基于新的索引库的图像识别"></a>

H
HydrogenSulfate 已提交
337
#### 2.3.3 基于新的索引库的图像识别
littletomatodonkey's avatar
littletomatodonkey 已提交
338 339 340 341 342

使用新的索引库,对上述图像进行识别,运行命令如下。

```shell
# 使用下面的命令使用 GPU 进行预测,如果希望使用 CPU 预测,可以在命令后面添加 -o Global.use_gpu=False
H
HydrogenSulfate 已提交
343
python3.7 python/predict_system.py -c configs/inference_general.yaml -o Global.infer_imgs="././drink_dataset_v2.0/test_images/mosilian.jpeg" -o IndexProcess.index_dir="./drink_dataset_v2.0/index_all"
littletomatodonkey's avatar
littletomatodonkey 已提交
344 345 346 347
```

输出结果如下。

H
HydrogenSulfate 已提交
348
```log
H
HydrogenSulfate 已提交
349
[{'bbox': [290, 297, 564, 919], 'rec_docs': '光明_莫斯利安', 'rec_scores': 0.59137374}]
littletomatodonkey's avatar
littletomatodonkey 已提交
350 351
```

littletomatodonkey's avatar
littletomatodonkey 已提交
352
最终识别结果为`光明_莫斯利安`,识别正确,识别结果可视化如下所示。
littletomatodonkey's avatar
littletomatodonkey 已提交
353

S
sibo2rr 已提交
354
![](../../images/recognition/drink_data_demo/output/mosilian.jpeg)
littletomatodonkey's avatar
littletomatodonkey 已提交
355 356


H
HydrogenSulfate 已提交
357
<a name="5"></a>
H
HydrogenSulfate 已提交
358

H
HydrogenSulfate 已提交
359
### 2.4 服务端识别模型列表
littletomatodonkey's avatar
littletomatodonkey 已提交
360

361
目前,我们更推荐您使用[轻量级通用主体检测模型与轻量级通用识别模型](#轻量级通用主体检测模型与轻量级通用识别模型),以获得更好的测试结果。但是如果您希望体验服务端识别模型,服务器端通用主体检测模型与各方向识别模型、测试数据下载地址以及对应的配置文件地址如下。
littletomatodonkey's avatar
littletomatodonkey 已提交
362

H
HydrogenSulfate 已提交
363 364 365 366 367 368 369 370
| 模型简介         | 推荐场景       | inference 模型                                                                                                                               | 预测配置文件                                                             |
| ---------------- | -------------- | -------------------------------------------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------ |
| 通用主体检测模型 | 通用场景       | [模型下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/ppyolov2_r50vd_dcn_mainbody_v1.0_infer.tar)    | -                                                                        |
| Logo 识别模型    | Logo 场景      | [模型下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/logo_rec_ResNet50_Logo3K_v1.0_infer.tar)       | [inference_logo.yaml](../../../deploy/configs/inference_logo.yaml)       |
| 动漫人物识别模型 | 动漫人物场景   | [模型下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/cartoon_rec_ResNet50_iCartoon_v1.0_infer.tar)  | [inference_cartoon.yaml](../../../deploy/configs/inference_cartoon.yaml) |
| 车辆细分类模型   | 车辆场景       | [模型下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/vehicle_cls_ResNet50_CompCars_v1.0_infer.tar)  | [inference_vehicle.yaml](../../../deploy/configs/inference_vehicle.yaml) |
| 商品识别模型     | 商品场景       | [模型下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/product_ResNet50_vd_aliproduct_v1.0_infer.tar) | [inference_product.yaml](../../../deploy/configs/inference_product.yaml) |
| 车辆 ReID 模型   | 车辆 ReID 场景 | [模型下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/vehicle_reid_ResNet50_VERIWild_v1.0_infer.tar) | [inference_vehicle.yaml](../../../deploy/configs/inference_vehicle.yaml) |
littletomatodonkey's avatar
littletomatodonkey 已提交
371

S
sibo2rr 已提交
372 373 374 375
```shell
cd PaddleClas/deploy/
mkdir -p models
```
376 377

```shell
S
sibo2rr 已提交
378
cd ./models
379
# 下载通用主体检测模型并解压
S
sibo2rr 已提交
380
wget https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/ppyolov2_r50vd_dcn_mainbody_v1.0_infer.tar && tar -xf ppyolov2_r50vd_dcn_mainbody_v1.0_infer.tar
381 382 383 384
# 下载识别模型并解压
wget {识别模型下载链接地址} && tar -xf {压缩包的名称}
```

S
sibo2rr 已提交
385
使用如下命令下载各方向识别模型的测试数据:
386 387

```shell
S
sibo2rr 已提交
388
# 回到 deploy 目录下
S
sibo2rr 已提交
389
cd ..
390 391 392 393 394 395
# 下载测试数据并解压
wget https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/data/recognition_demo_data_en_v1.1.tar && tar -xf recognition_demo_data_en_v1.1.tar
```

解压完毕后,`recognition_demo_data_v1.1` 文件夹下应有如下文件结构:

H
HydrogenSulfate 已提交
396
```log
397 398 399 400 401 402 403 404 405 406 407 408 409 410
├── recognition_demo_data_v1.1
│   ├── gallery_cartoon
│   ├── gallery_logo
│   ├── gallery_product
│   ├── gallery_vehicle
│   ├── test_cartoon
│   ├── test_logo
│   ├── test_product
│   └── test_vehicle
├── ...
```

按照上述步骤下载模型和测试数据后,您可以进行相关方向识别模型的测试。

littletomatodonkey's avatar
littletomatodonkey 已提交
411
* 更多关于主体检测的介绍可以参考:[主体检测教程文档](../image_recognition_pipeline/mainbody_detection.md);关于特征提取的介绍可以参考:[特征提取教程文档](../image_recognition_pipeline/feature_extraction.md);关于向量检索的介绍可以参考:[向量检索教程文档](../image_recognition_pipeline/vector_search.md)