application_scenarios.md 13.4 KB
Newer Older
悟、's avatar
悟、 已提交
1 2 3 4
# PP-ShiTu应用场景介绍

该文档介绍了PP-ShiTu提供的各种应用场景库简介、下载链接以及使用简介。

悟、's avatar
悟、 已提交
5 6
------

悟、's avatar
悟、 已提交
7 8
## 目录

悟、's avatar
悟、 已提交
9 10
- [1. 应用场景介绍](#1-应用场景介绍)
- [2. 使用说明](#2-使用说明)
悟、's avatar
悟、 已提交
11 12 13 14 15
  - [2.1 环境配置](#21-环境配置)
  - [2.2 下载、解压场景库数据](#22-下载解压场景库数据)
  - [2.3 准备模型](#23-准备模型)
  - [2.4 场景库识别与检索](#24-场景库识别与检索)
    - [2.4.1 识别单张图像](#241-识别单张图像)
悟、's avatar
悟、 已提交
16
    - [2.4.2 基于文件夹的批量识别](#242-基于文件夹的批量识别)
悟、's avatar
悟、 已提交
17

悟、's avatar
悟、 已提交
18

悟、's avatar
悟、 已提交
19
<a name="1. 应用场景介绍"></a>
悟、's avatar
悟、 已提交
20

悟、's avatar
悟、 已提交
21 22
## 1. 应用场景介绍

悟、's avatar
悟、 已提交
23
PP-ShiTu对原数据集进行了`Gallery`库和`Query`库划分,并生成了对应的`Index`索引库,具体应用场景介绍和下载地址如下表所示。
悟、's avatar
悟、 已提交
24

悟、's avatar
悟、 已提交
25 26
| 场景 |示例图|场景简介|Recall@1|场景库下载地址|原数据集下载地址|
|:---:|:---:|:---:|:---:|:---:|:---:|
悟、's avatar
悟、 已提交
27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
| 花 | <img src="../../../images/ppshitu_application_scenarios/104flowers.jpeg" height = "100"> |104种花细分类识别 | 0.9788 | [104flowers](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/data/PP-ShiTuV2_application_dataset/104flowers.tar) | [原数据下载地址](https://www.kaggle.com/datasets/msheriey/104-flowers-garden-of-eden) |
| 交通工具 | <img src="../../../images/ppshitu_application_scenarios/Vechicles.jpg" height = "100"> |车、船等交通工具粗分类识别 | 0.9307 | [Vechicles](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/data/PP-ShiTuV2_application_dataset/Vechicles.tar) | [原数据下载地址](https://www.kaggle.com/datasets/rishabkoul1/vechicle-dataset) |
| 动物 | <img src="../../../images/ppshitu_application_scenarios/AnimalImageDataset.jpg" height = "100"> |各种动物识别 | 0.9078 | [AnimalImageDataset](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/data/PP-ShiTuV2_application_dataset/AnimalImageDataset.tar) | [原数据下载地址](https://www.kaggle.com/datasets/iamsouravbanerjee/animal-image-dataset-90-different-animals) |
| 时装 | <img src="../../../images/ppshitu_application_scenarios/FashionProductsImage.jpg" height = "100"> |首饰、挎包、化妆品等时尚商品识别 | 0.9555 | [FashionProductImageSmall](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/data/PP-ShiTuV2_application_dataset/FashionProductImageSmall.tar) | [原数据下载地址](https://www.kaggle.com/datasets/paramaggarwal/fashion-product-images-small) |
| 球类 | <img src="../../../images/ppshitu_application_scenarios/Ball.jpg" height = "100"> |各种球类识别 | 0.9769 | [Balls](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/data/PP-ShiTuV2_application_dataset/Balls.tar) | [原数据下载地址](https://www.kaggle.com/datasets/gpiosenka/balls-image-classification) |
| 狗识别 | <img src="../../../images/ppshitu_application_scenarios/DogBreeds.jpg" height = "100"> | 狗细分类识别,包括69种狗的图像 | 0.9606 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/gpiosenka/70-dog-breedsimage-data-set) |
| 宝石 | <img src="../../../images/ppshitu_application_scenarios/Gemstones.jpg" height = "100"> | 宝石种类识别 | 0.9653 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/lsind18/gemstones-images) |
| 鸟类 | <img src="../../../images/ppshitu_application_scenarios/Bird400.jpg" height = "100"> |鸟细分类识别,包括400种各种姿态的鸟类图像 | 0.9673 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/gpiosenka/100-bird-species) |
| 运动种类 | <img src="../../../images/ppshitu_application_scenarios/100sports.jpg" height = "100"> |100种运动图像识别 | 0.9413 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/gpiosenka/sports-classification) |
| 乐器 | <img src="../../../images/ppshitu_application_scenarios/MusicInstruments.jpg" height = "100"> |30种不同乐器种类识别 | 0.9467 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/gpiosenka/musical-instruments-image-classification) |
| 宝可梦 | <img src="../../../images/ppshitu_application_scenarios/Pokemon.png" height = "100"> |宝可梦神奇宝贝识别 | 0.9236 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/lantian773030/pokemonclassification) |
| 船 | <img src="../../../images/ppshitu_application_scenarios/Boat.jpg" height = "100"> |船种类识别 |0.9242 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/imsparsh/dockship-boat-type-classification) |
| 鞋子 | <img src="../../../images/ppshitu_application_scenarios/Shoes.jpeg" height = "100"> |鞋子种类识别,包括靴子、拖鞋等 | 0.9000 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/noobyogi0100/shoe-dataset) |
| 巴黎建筑 | <img src="../../../images/ppshitu_application_scenarios/Paris.jpg" height = "100"> |巴黎著名建筑景点识别,如:巴黎铁塔、圣母院等 | 1.000 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/skylord/oxbuildings) |
| 蝴蝶 | <img src="../../../images/ppshitu_application_scenarios/Butterfly.jpg" height = "100"> |75种蝴蝶细分类识别 | 0.9360 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/gpiosenka/butterfly-images40-species) |
| 野外植物 | <img src="../../../images/ppshitu_application_scenarios/WildEdiblePlants.jpg" height = "100"> |野外植物识别 | 0.9758 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/ryanpartridge01/wild-edible-plants) |
| 天气 | <img src="../../../images/ppshitu_application_scenarios/WeatherImageRecognition.jpg" height = "100"> |各种天气场景识别,如:雨天、打雷、下雪等 | 0.9924 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/jehanbhathena/weather-dataset) |
| 坚果 | <img src="../../../images/ppshitu_application_scenarios/TreeNuts.jpg" height = "100"> |各种坚果种类识别 | 0.9412 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/gpiosenka/tree-nuts-image-classification) |
| 垃圾 | <img src="../../../images/ppshitu_application_scenarios/Garbage12.jpg" height = "100"> |12种垃圾分类识别 | 0.9845 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/mostafaabla/garbage-classification) |
| 航拍场景 | <img src="../../../images/ppshitu_application_scenarios/AID.jpg" height = "100"> |各种航拍场景识别,如机场、火车站等 | 0.9797 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/jiayuanchengala/aid-scene-classification-datasets) |
| 蔬菜 | <img src="../../../images/ppshitu_application_scenarios/Veg200.jpg" height = "100"> |各种蔬菜识别 | 0.8929 | 添加技术交流群后即可获得 | [原数据下载地址](https://www.kaggle.com/datasets/zhaoyj688/vegfru) |
D
dongshuilong 已提交
48 49 50 51 52

<div align="center">
  <img src="https://user-images.githubusercontent.com/11568925/189877049-d17ddcea-22d2-44ab-91fe-36d12af3add8.png" width = "200" height = "200"/>
<p>添加二维码获取相关场景库及大礼包</p>
</div>
悟、's avatar
悟、 已提交
53 54 55 56 57

<a name="2. 使用说明"></a>

## 2. 使用说明

悟、's avatar
悟、 已提交
58 59 60
<a name="2.1 环境配置"></a>

### 2.1 环境配置
61
- 安装:请先参考文档[环境准备](../../installation.md)配置PaddleClas运行环境
悟、's avatar
悟、 已提交
62 63 64 65 66
- 进入`deploy`运行目录,本部分所有内容与命令均需要在`deploy`目录下运行,可以通过下面命令进入`deploy`目录。
```shell
cd deploy
```

悟、's avatar
悟、 已提交
67

悟、's avatar
悟、 已提交
68 69 70
<a name="2.2 下载、解压场景库数据"></a>

### 2.2 下载、解压场景库数据
悟、's avatar
悟、 已提交
71
首先创建存放场景库的地址`deploy/datasets`:
悟、's avatar
悟、 已提交
72

悟、's avatar
悟、 已提交
73 74 75
```shell
mkdir datasets
```
悟、's avatar
悟、 已提交
76
下载并解压对应场景库到`deploy/datasets`中。
悟、's avatar
悟、 已提交
77 78
```shell
cd datasets
悟、's avatar
悟、 已提交
79 80

# 下载并解压场景库数据
悟、's avatar
悟、 已提交
81
wget {场景库下载链接} && tar -xf {压缩包的名称}
悟、's avatar
悟、 已提交
82 83 84 85
```
`dataset_name`为例,解压完毕后,`datasets/dataset_name`文件夹下应有如下文件结构:
```shel
├── dataset_name/
悟、's avatar
悟、 已提交
86 87 88
│   ├── Gallery/
│   ├── Index/
│   ├── Query/
悟、's avatar
悟、 已提交
89 90
│   ├── gallery_list.txt/
│   ├── query_list.txt/
悟、's avatar
悟、 已提交
91
│   ├── label_list.txt/
悟、's avatar
悟、 已提交
92 93
├── ...
```
悟、's avatar
悟、 已提交
94
其中,`Gallery`文件夹中存放的是用于构建索引库的原始图像,`Index`表示基于原始图像构建得到的索引库信息,`Query`文件夹存放的是用于检索的图像列表,`gallery_list.txt``query_list.txt`分别为索引库和检索图像的标签文件,`label_list.txt`是标签的中英文对照文件(注意:商标场景库文件不包含中英文对照文件)。
悟、's avatar
悟、 已提交
95

悟、's avatar
悟、 已提交
96
<a name="2.3 准备识别模型"></a>
悟、's avatar
悟、 已提交
97

悟、's avatar
悟、 已提交
98
### 2.3 准备模型
悟、's avatar
悟、 已提交
99
创建存放模型的文件夹`deploy/models`,并下载轻量级主体检测、识别模型,命令如下:
悟、's avatar
悟、 已提交
100
```shell
悟、's avatar
悟、 已提交
101 102 103
cd ..
mkdir models
cd models
悟、's avatar
悟、 已提交
104

悟、's avatar
悟、 已提交
105
# 下载检测模型并解压
悟、's avatar
悟、 已提交
106 107
# wget {检测模型下载链接} && tar -xf {检测模型压缩包名称}
wget https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/PP-ShiTuV2/general_PPLCNetV2_base_pretrained_v1.0_infer.tar && tar -xf general_PPLCNetV2_base_pretrained_v1.0_infer.tar
悟、's avatar
悟、 已提交
108

悟、's avatar
悟、 已提交
109
# 下载识别 inference 模型并解压
悟、's avatar
悟、 已提交
110 111
#wget {识别模型下载链接} && tar -xf {识别模型压缩包名称}
wget https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/rec/models/inference/picodet_PPLCNet_x2_5_mainbody_lite_v1.0_infer.tar && tar -xf picodet_PPLCNet_x2_5_mainbody_lite_v1.0_infer.tar
悟、's avatar
悟、 已提交
112 113 114 115 116 117 118 119
```

解压完成后,`models`文件夹下有如下文件结构:
```
├── inference_model_name
│   ├── inference.pdiparams
│   ├── inference.pdiparams.info
│   └── inference.pdmodel
悟、's avatar
悟、 已提交
120 121 122 123
└── det_model_name
    ├── inference.pdiparams
    ├── inference.pdiparams.info
    └── inference.pdmodel
悟、's avatar
悟、 已提交
124
```
悟、's avatar
悟、 已提交
125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142

<a name="2.4 场景库识别与检索"></a>

### 2.4 场景库识别与检索

`动物识别`场景为例,展示识别和检索过程(如果希望尝试其他场景库的识别与检索效果,在下载解压好对应的场景库数据和模型后,替换对应的配置文件即可完成预测)。

注意,此部分使用了`faiss`作为检索库,安装方法如下:
```shell
pip install faiss-cpu==1.7.1post2
```

若使用时,不能正常引用,则`uninstall`之后,重新`install`,尤其是在windows下。

<a name="2.4.1 识别单张图像"></a>

#### 2.4.1 识别单张图像

悟、's avatar
悟、 已提交
143
假设需要测试`./datasets/AnimalImageDataset/Query/羚羊/0a37838e99.jpg`这张图像识别和检索效果。
悟、's avatar
悟、 已提交
144

悟、's avatar
悟、 已提交
145
首先分别修改配置文件`./configs/inference_general.yaml`中的`Global.det_inference_model_dir``Global.rec_inference_model_dir`字段为对应的检测和识别模型文件夹,以及修改测试图像地址字段`Global.infer_imgs`示例如下:
悟、's avatar
悟、 已提交
146 147 148

```shell
Global:
悟、's avatar
悟、 已提交
149 150 151
  infer_imgs: './datasets/AnimalImageDataset/Query/羚羊/0a37838e99.jpg'
  det_inference_model_dir: './models/picodet_PPLCNet_x2_5_mainbody_lite_v1.0_infer.tar'
  rec_inference_model_dir: './models/general_PPLCNetV2_base_pretrained_v1.0_infer.tar'
悟、's avatar
悟、 已提交
152 153
```

悟、's avatar
悟、 已提交
154
并修改配置文件`./configs/inference_general.yaml`中的`IndexProcess.index_dir`字段为对应场景index库地址:
悟、's avatar
悟、 已提交
155 156 157

```shell
IndexProcess:
悟、's avatar
悟、 已提交
158
  index_dir:'./datasets/AnimalImageDataset/Index/'
悟、's avatar
悟、 已提交
159 160 161
```


悟、's avatar
悟、 已提交
162
运行下面的命令,对图像`./datasets/AnimalImageDataset/Query/羚羊/0a37838e99.jpg`进行识别与检索
悟、's avatar
悟、 已提交
163 164 165 166 167 168 169 170 171 172 173

```shell
# 使用下面的命令使用 GPU 进行预测
python3.7 python/predict_system.py -c configs/inference_general.yaml

# 使用下面的命令使用 CPU 进行预测
python3.7 python/predict_system.py -c configs/inference_general.yaml -o Global.use_gpu=False
```

最终输出结果如下:
```
悟、's avatar
悟、 已提交
174
[{'bbox': [609, 70, 1079, 629], 'rec_docs': '羚羊', 'rec_scores': 0.6571544}]
悟、's avatar
悟、 已提交
175 176 177 178
```
其中`bbox`表示检测出的主体所在位置,`rec_docs`表示索引库中与检测框最为相似的类别,`rec_scores`表示对应的置信度。
检测的可视化结果也保存在`output`文件夹下,对于本张图像,识别结果可视化如下所示。

179
![](../../../images/ppshitu_application_scenarios/systerm_result.jpg)
悟、's avatar
悟、 已提交
180 181 182 183

<a name="2.4.2 基于文件夹的批量识别"></a>

#### 2.4.2 基于文件夹的批量识别
悟、's avatar
悟、 已提交
184 185 186 187 188

如果希望预测文件夹内的图像,可以直接修改配置文件中`Global.infer_imgs`字段,也可以通过下面的`-o`参数修改对应的配置。

```shell
# 使用下面的命令使用 GPU 进行预测,如果希望使用 CPU 预测,可以在命令后面添加 -o Global.use_gpu=False
悟、's avatar
悟、 已提交
189
python3.7 python/predict_system.py -c configs/inference_general.yaml -o Global.infer_imgs="./datasets/AnimalImageDataset/Query/羚羊"
悟、's avatar
悟、 已提交
190 191 192 193
```
终端中会输出该文件夹内所有图像的识别结果,如下所示。
```
...
悟、's avatar
悟、 已提交
194 195 196 197 198 199 200
[{'bbox': [0, 0, 1200, 675], 'rec_docs': '羚羊', 'rec_scores': 0.6153812}]
[{'bbox': [0, 0, 275, 183], 'rec_docs': '羚羊', 'rec_scores': 0.77218026}]
[{'bbox': [264, 79, 1088, 850], 'rec_docs': '羚羊', 'rec_scores': 0.81452656}]
[{'bbox': [0, 0, 188, 268], 'rec_docs': '羚羊', 'rec_scores': 0.637074}]
[{'bbox': [118, 41, 235, 161], 'rec_docs': '羚羊', 'rec_scores': 0.67315465}]
[{'bbox': [0, 0, 175, 287], 'rec_docs': '羚羊', 'rec_scores': 0.68271667}]
[{'bbox': [0, 0, 310, 163], 'rec_docs': '羚羊', 'rec_scores': 0.6706451}]
悟、's avatar
悟、 已提交
201 202 203
...
```
所有图像的识别结果可视化图像也保存在`output`文件夹内。