README_ch.md 9.0 KB
Newer Older
L
littletomatodonkey 已提交
1 2 3 4 5 6 7 8
简体中文 | [English](README_en.md)

# PaddleClas

## 简介

飞桨图像识别套件PaddleClas是飞桨为工业界和学术界所准备的一个图像识别任务的工具集,助力使用者训练出更好的视觉模型和应用落地。

W
weishengyu 已提交
9 10 11 12 13 14 15 16 17 18 19
<div align="center">
<img src="./docs/images/class_simple.gif"  width = "600" />

PULC实用图像分类模型效果展示
</div>
&nbsp;


<div align="center">
<img src="./docs/images/recognition.gif"  width = "400" />

W
dbg  
weishengyu 已提交
20
PP-ShiTu图像识别系统效果展示
W
weishengyu 已提交
21 22 23
</div>


W
dbg  
weishengyu 已提交
24
## 近期更新
W
weishengyu 已提交
25 26
- 🔥️ 2022.6.15 发布PULC超轻量图像分类方案,CPU推理3ms,精度比肩SwinTransformer,覆盖人、车、OCR场景九大常见任务
- 2022.5.26 [飞桨产业实践范例直播课](http://aglc.cn/v-c4FAR),解读**超轻量重点区域人员出入管理方案**
C
cuicheng01 已提交
27
- 2022.5.23 新增[人员出入管理范例库](https://aistudio.baidu.com/aistudio/projectdetail/4094475),具体内容可以在 AI Stuio 上体验。
C
cuicheng01 已提交
28
- 2022.5.20 上线[PP-HGNet](./docs/zh_CN/models/PP-HGNet.md), [PP-LCNet v2](./docs/zh_CN/models/PP-LCNetV2.md)
C
cuicheng01 已提交
29
- 2022.4.21 新增 CVPR2022 oral论文 [MixFormer](https://arxiv.org/pdf/2204.02557.pdf) 相关[代码](https://github.com/PaddlePaddle/PaddleClas/pull/1820/files)
W
Wei Shengyu 已提交
30
- 2022.1.27 全面升级文档;新增[PaddleServing C++ pipeline部署方式](./deploy/paddleserving)[18M图像识别安卓部署Demo](./deploy/lite_shitu)
C
cuicheng01 已提交
31 32
- 2021.11.1 发布[PP-ShiTu技术报告](https://arxiv.org/pdf/2111.00775.pdf),新增饮料识别demo
- 2021.10.23 发布轻量级图像识别系统PP-ShiTu,CPU上0.2s即可完成在10w+库的图像识别。
W
weishengyu 已提交
33
[点击这里](./docs/zh_CN/quick_start/quick_start_recognition.md)立即体验
C
cuicheng01 已提交
34
- 2021.09.17 发布PP-LCNet系列超轻量骨干网络模型, 在Intel CPU上,单张图像预测速度约5ms,ImageNet-1K数据集上Top1识别准确率达到80.82%,超越ResNet152的模型效果。PP-LCNet的介绍可以参考[论文](https://arxiv.org/pdf/2109.15099.pdf), 或者[PP-LCNet模型介绍](docs/zh_CN/models/PP-LCNet.md),相关指标和预训练权重可以从 [这里](docs/zh_CN/algorithm_introduction/ImageNet_models.md)下载。
W
weishengyu 已提交
35
- [more](./docs/zh_CN/others/update_history.md)
L
littletomatodonkey 已提交
36 37 38

## 特性

W
dbg  
weishengyu 已提交
39
支持多种图像分类、识别相关算法,在此基础上打造[PULC超轻量图像分类方案](./docs/zh_CN/PULC/PULC_train.md)[PP-ShiTu图像识别系统](./docs/zh_CN/quick_start/quick_start_recognition.md)
W
weishengyu 已提交
40
![](https://user-images.githubusercontent.com/19523330/172844483-60391f39-f045-4e13-b5a6-ed65182f429e.png)
W
dbg  
weishengyu 已提交
41

L
littletomatodonkey 已提交
42 43 44

## 欢迎加入技术交流群

G
gaotingquan 已提交
45
* 您可以扫描下面的QQ/微信二维码(添加小助手微信并回复“C”),加入PaddleClas微信交流群,获得更高效的问题答疑,与各行各业开发者充分交流,期待您的加入。
L
littletomatodonkey 已提交
46 47

<div align="center">
G
gaotingquan 已提交
48 49
<img src="https://user-images.githubusercontent.com/80816848/164383225-e375eb86-716e-41b4-a9e0-4b8a3976c1aa.jpg" width="200"/>
<img src="https://user-images.githubusercontent.com/48054808/160531099-9811bbe6-cfbb-47d5-8bdb-c2b40684d7dd.png" width="200"/>
L
littletomatodonkey 已提交
50 51 52 53
</div>

## 快速体验

W
dbg  
weishengyu 已提交
54
PULC超轻量图像分类方案快速体验:[点击这里](./docs/zh_CN/PULC/PULC_train.md)
W
weishengyu 已提交
55
PP-ShiTu图像识别快速体验:[点击这里](./docs/zh_CN/quick_start/quick_start_recognition.md)
L
littletomatodonkey 已提交
56

D
dyning 已提交
57
## 文档教程
W
weishengyu 已提交
58
- [环境准备]()
W
dbg  
weishengyu 已提交
59 60 61 62 63 64 65 66 67 68 69
- [PULC超轻量图像分类实用方案]() 文档更新中
  - [超轻量图像分类快速体验]() 文档更新中
  - [超轻量图像分类模型库]() 文档更新中
  - [方案介绍和模型训练]() 文档更新中
  - [推理部署]() 文档更新中
    - [基于python预测引擎推理]() 文档更新中
    - [基于C++预测引擎推理]() 文档更新中
    - [服务化部署]() 文档更新中
    - [端侧部署]() 文档更新中
    - [Paddle2ONNX模型转化与预测]() 文档更新中
  - [模型压缩]() 文档更新中
W
weishengyu 已提交
70
- [PP-ShiTu图像识别系统介绍](#图像识别系统介绍)
W
dbg  
weishengyu 已提交
71 72
  - [图像识别快速体验]() 文档更新中
  - 模块介绍
littletomatodonkey's avatar
littletomatodonkey 已提交
73
    - [主体检测](./docs/zh_CN/image_recognition_pipeline/mainbody_detection.md)
W
weishengyu 已提交
74
    - [特征提取模型](./docs/zh_CN/image_recognition_pipeline/feature_extraction.md)
littletomatodonkey's avatar
littletomatodonkey 已提交
75
    - [向量检索](./docs/zh_CN/image_recognition_pipeline/vector_search.md)
W
dbg  
weishengyu 已提交
76 77 78 79 80 81 82 83 84 85 86
    - [哈希编码]() 文档更新中
  - [模型训练]() 文档更新中
  - [推理部署]() 文档更新中
    - [基于python预测引擎推理]() 文档更新中
    - [基于C++预测引擎推理]() 文档更新中
    - [服务化部署]() 文档更新中
    - [端侧部署]() 文档更新中
    - [Paddle2ONNX模型转化与预测]() 文档更新中
  - [模型压缩]() 文档更新中
    - [模型量化]() 文档更新中
    - [模型裁剪]() 文档更新中
W
weishengyu 已提交
87
  - [骨干网络和预训练模型库](./docs/zh_CN/algorithm_introduction/ImageNet_models.md)
W
dbg  
weishengyu 已提交
88 89 90 91 92 93 94 95
- [PP系列骨干网络模型]() 文档更新中
  - [PP-HGNet]() 文档更新中
  - [PP-LCNet v2]() 文档更新中
  - [PP-LCNet]() 文档更新中
- [SSLD半监督知识蒸馏方案]() 文档更新中
  - [SSLD算法简介]() 文档更新中
  - [预训练模型库]() 文档更新中
  - [使用方法]() 文档更新中
W
weishengyu 已提交
96
- 前沿算法
W
dbg  
weishengyu 已提交
97 98 99 100 101 102 103 104 105 106 107 108
  - [骨干网络和预训练模型库]() 文档更新中
    - [服务端CNN模型库]() 文档更新中
    - [移动端CNN模型库]() 文档更新中
    - [Vision Transformer模型库]() 文档更新中
  - [度量学习]() 文档更新中
  - [ReID]() 文档更新中
  - [向量检索]() 文档更新中
  - [哈希特征]() 文档更新中
  - [模型蒸馏]() 文档更新中
  - [数据增强]() 文档更新中
- [产业实用范例库]() 文档更新中
- [30分钟快速体验图像分类]() 文档更新中
W
weishengyu 已提交
109
- FAQ
W
weishengyu 已提交
110 111 112 113 114 115
  - [图像识别精选问题](docs/zh_CN/faq_series/faq_2021_s2.md)
  - [图像分类精选问题](docs/zh_CN/faq_series/faq_selected_30.md)
  - [图像分类FAQ第一季](docs/zh_CN/faq_series/faq_2020_s1.md)
  - [图像分类FAQ第二季](docs/zh_CN/faq_series/faq_2021_s1.md)
- [PaddleClas结构解析](./docs/zh_CN/advanced_tutorials/code_overview.md)
- [社区贡献指南](./docs/zh_CN/advanced_tutorials/how_to_contribute.md)
L
littletomatodonkey 已提交
116 117 118
- [许可证书](#许可证书)
- [贡献代码](#贡献代码)

W
weishengyu 已提交
119 120 121 122 123 124 125 126 127

<a name="PULC超轻量图像分类方案"></a>
## PULC超轻量图像分类方案
<div align="center">
<img src="https://user-images.githubusercontent.com/19523330/172848493-5cf14ec3-3285-4d26-b476-391c5653972f.png"  width = "800" />
</div>
PULC融合了骨干网络、数据增广、蒸馏等多种前沿算法,可以自动训练得到轻量且高精度的图像分类模型。
PaddleClas提供了覆盖人、车、OCR场景九大常见任务的分类模型,CPU推理3ms,精度比肩SwinTransformer。

littletomatodonkey's avatar
littletomatodonkey 已提交
128
<a name="图像识别系统介绍"></a>
W
dbg  
weishengyu 已提交
129
## PP-ShiTu图像识别系统
L
littletomatodonkey 已提交
130 131

<div align="center">
W
weishengyu 已提交
132
<img src="./docs/images/structure.jpg"  width = "800" />
L
littletomatodonkey 已提交
133 134
</div>

C
cuicheng01 已提交
135
PP-ShiTu是一个实用的轻量级通用图像识别系统,主要由主体检测、特征学习和向量检索三个模块组成。该系统从骨干网络选择和调整、损失函数的选择、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型裁剪量化8个方面,采用多种策略,对各个模块的模型进行优化,最终得到在CPU上仅0.2s即可完成10w+库的图像识别的系统。更多细节请参考[PP-ShiTu技术方案](https://arxiv.org/pdf/2111.00775.pdf)
L
littletomatodonkey 已提交
136

W
dbg  
weishengyu 已提交
137 138 139 140 141
<a name="分类效果展示"></a>
## PULC实用图像分类模型效果展示
<div align="center">
<img src="docs/images/classification.gif">
</div>
L
littletomatodonkey 已提交
142 143

<a name="识别效果展示"></a>
littletomatodonkey's avatar
littletomatodonkey 已提交
144
## PP-ShiTu图像识别系统效果展示
W
weishengyu 已提交
145 146 147 148
- 瓶装饮料识别
<div align="center">
<img src="docs/images/drink_demo.gif">
</div>
W
dbg  
weishengyu 已提交
149

L
littletomatodonkey 已提交
150 151
- 商品识别
<div align="center">
L
LaraStuStu 已提交
152
<img src="https://user-images.githubusercontent.com/18028216/122769644-51604f80-d2d7-11eb-8290-c53b12a5c1f6.gif"  width = "400" />
L
littletomatodonkey 已提交
153 154 155 156
</div>

- 动漫人物识别
<div align="center">
L
LaraStuStu 已提交
157
<img src="https://user-images.githubusercontent.com/18028216/122769746-6b019700-d2d7-11eb-86df-f1d710999ba6.gif"  width = "400" />
L
littletomatodonkey 已提交
158 159 160 161
</div>

- logo识别
<div align="center">
L
LaraStuStu 已提交
162
<img src="https://user-images.githubusercontent.com/18028216/122769837-7fde2a80-d2d7-11eb-9b69-04140e9d785f.gif"  width = "400" />
L
littletomatodonkey 已提交
163 164
</div>

L
LaraStuStu 已提交
165

L
littletomatodonkey 已提交
166 167
- 车辆识别
<div align="center">
L
LaraStuStu 已提交
168
<img src="https://user-images.githubusercontent.com/18028216/122769916-8ec4dd00-d2d7-11eb-8c60-42d89e25030c.gif"  width = "400" />
L
littletomatodonkey 已提交
169 170
</div>

L
LaraStuStu 已提交
171

L
littletomatodonkey 已提交
172 173 174 175 176 177 178 179 180
<a name="许可证书"></a>

## 许可证书
本项目的发布受<a href="https://github.com/PaddlePaddle/PaddleCLS/blob/master/LICENSE">Apache 2.0 license</a>许可认证。


<a name="贡献代码"></a>
## 贡献代码
我们非常欢迎你为PaddleClas贡献代码,也十分感谢你的反馈。
W
weishengyu 已提交
181 182
如果想为PaddleCLas贡献代码,可以参考[贡献指南](./docs/zh_CN/advanced_tutorials/how_to_contribute.md)

L
littletomatodonkey 已提交
183 184 185
- 非常感谢[nblib](https://github.com/nblib)修正了PaddleClas中RandErasing的数据增广配置文件。
- 非常感谢[chenpy228](https://github.com/chenpy228)修正了PaddleClas文档中的部分错别字。
- 非常感谢[jm12138](https://github.com/jm12138)为PaddleClas添加ViT,DeiT系列模型和RepVGG系列模型。