README_ch.md 9.3 KB
Newer Older
L
littletomatodonkey 已提交
1 2 3 4 5 6
简体中文 | [English](README_en.md)

# PaddleClas

## 简介

D
dongshuilong 已提交
7
飞桨图像识别套件PaddleClas是飞桨为工业界和学术界所准备的一个图像识别和图像分类任务的工具集,助力使用者训练出更好的视觉模型和应用落地。 
W
weishengyu 已提交
8 9 10

<div align="center">
<img src="./docs/images/recognition.gif"  width = "400" />
D
dongshuilong 已提交
11
<p>PP-ShiTuV2图像识别系统效果展示</p>
W
weishengyu 已提交
12 13 14
</div>


L
lilithzhou 已提交
15

D
dyning 已提交
16
<div align="center">
D
dongshuilong 已提交
17 18
<img src="./docs/images/class_simple.gif"  width = "600" />
<p>PULC实用图像分类模型效果展示</p>
D
dyning 已提交
19
</div>
L
lilithzhou 已提交
20 21 22



D
dongshuilong 已提交
23
## 近期更新
L
lilithzhou 已提交
24

D
dongshuilong 已提交
25 26 27 28
- 🔥️ 发布[PP-ShiTuV2](./docs/zh_CN/PPShiTu/PPShiTuV2_introduction.md),recall1精度提升10个点,覆盖20+识别场景,新增库管理工具,Android Demo全新体验。
- 2022.9.4 新增[生鲜产品自主结算范例库](https://aistudio.baidu.com/aistudio/projectdetail/4486158),具体内容可以在AI Studio上体验。
- 2022.6.15 发布[PULC超轻量图像分类实用方案](docs/zh_CN/PULC/PULC_train.md),CPU推理3ms,精度比肩SwinTransformer,覆盖人、车、OCR场景九大常见任务。
- 2022.5.23 新增[人员出入管理范例库](https://aistudio.baidu.com/aistudio/projectdetail/4094475),具体内容可以在 AI Studio 上体验。
D
dyning 已提交
29
- 2022.5.20 上线[PP-HGNet](./docs/zh_CN/models/PP-HGNet.md), [PP-LCNetv2](./docs/zh_CN/models/PP-LCNetV2.md)
W
weishengyu 已提交
30
- [more](./docs/zh_CN/others/update_history.md)
L
littletomatodonkey 已提交
31 32 33

## 特性

W
weishengyu 已提交
34
PaddleClas发布了[PP-HGNet](docs/zh_CN/models/PP-HGNet.md)[PP-LCNetv2](docs/zh_CN/models/PP-LCNetV2.md)[PP-LCNet](docs/zh_CN/models/PP-LCNet.md)[SSLD半监督知识蒸馏方案](docs/zh_CN/advanced_tutorials/ssld.md)等算法,
35
并支持多种图像分类、识别相关算法,在此基础上打造[PULC超轻量图像分类方案](docs/zh_CN/PULC/PULC_quickstart.md)[PP-ShiTu图像识别系统](./docs/zh_CN/quick_start/quick_start_recognition.md)
D
dongshuilong 已提交
36
![](https://user-images.githubusercontent.com/11568925/188055076-7b0e3492-55cb-420f-b61a-160d4dd0bb0d.png)
W
dbg  
weishengyu 已提交
37

L
littletomatodonkey 已提交
38 39 40

## 欢迎加入技术交流群

D
dongshuilong 已提交
41
* 欢迎加入PaddleClas 微信用户群(扫码填写问卷即可入群)
L
littletomatodonkey 已提交
42 43

<div align="center">
D
dongshuilong 已提交
44
  <img src="https://user-images.githubusercontent.com/45199522/173483779-2332f990-4941-4f8d-baee-69b62035fc31.png" width = "200" height = "200"/>
L
littletomatodonkey 已提交
45 46
</div>

D
dongshuilong 已提交
47

L
littletomatodonkey 已提交
48 49
## 快速体验

D
dyning 已提交
50
PULC超轻量图像分类方案快速体验:[点击这里](docs/zh_CN/PULC/PULC_quickstart.md)
W
dbg  
weishengyu 已提交
51

D
dyning 已提交
52
PP-ShiTu图像识别快速体验:[点击这里](./docs/zh_CN/quick_start/quick_start_recognition.md)
L
littletomatodonkey 已提交
53

D
dongshuilong 已提交
54 55 56 57 58
<div align="center">
<img src="./docs/images/quick_start/android_demo/PPShiTu_qrcode.png"  width = "400" />
<p>PP-ShiTuV2 Android Demo</p>
</div>

D
dyning 已提交
59
## 文档教程
W
weishengyu 已提交
60
- [环境准备](docs/zh_CN/installation/install_paddleclas.md)
D
dongshuilong 已提交
61 62 63 64 65 66 67 68 69 70 71 72 73 74
- [PP-ShiTuV2图像识别系统介绍](./docs/zh_CN/PPShiTu/PPShiTuV2_introduction.md)
  - [图像识别快速体验](docs/zh_CN/quick_start/quick_start_recognition.md)
  - 模块介绍
    - [主体检测](./docs/zh_CN/image_recognition_pipeline/mainbody_detection.md)
    - [特征提取模型](./docs/zh_CN/image_recognition_pipeline/feature_extraction.md)
    - [向量检索](./docs/zh_CN/image_recognition_pipeline/vector_search.md)
    - [哈希编码](docs/zh_CN/image_recognition_pipeline/)
  - [模型训练](docs/zh_CN/models_training/recognition.md)
  - 推理部署
    - [基于python预测引擎推理](docs/zh_CN/inference_deployment/python_deploy.md#2)
    - [基于C++预测引擎推理](deploy/cpp_shitu/readme.md)
    - [服务化部署](docs/zh_CN/inference_deployment/recognition_serving_deploy.md)
    - [端侧部署](docs/zh_CN/inference_deployment/lite_shitu.md)
    - [库管理工具](docs/zh_CN/inference_deployment/shitu_gallery_manager.md)
D
dongshuilong 已提交
75
 - [20+应用场景库](docs/zh_CN/introduction/ppshitu_application_scenarios.md)
C
cuicheng01 已提交
76
- [PULC超轻量图像分类实用方案](docs/zh_CN/PULC/PULC_train.md)
D
dyning 已提交
77
  - [超轻量图像分类快速体验](docs/zh_CN/PULC/PULC_quickstart.md)
W
Wei Shengyu 已提交
78
  - [超轻量图像分类模型库](docs/zh_CN/PULC/PULC_model_list.md)
W
weishengyu 已提交
79
    - [PULC有人/无人分类模型](docs/zh_CN/PULC/PULC_person_exists.md)
C
cuicheng01 已提交
80
    - [PULC人体属性识别模型](docs/zh_CN/PULC/PULC_person_attribute.md)
W
weishengyu 已提交
81 82 83
    - [PULC佩戴安全帽分类模型](docs/zh_CN/PULC/PULC_safety_helmet.md)
    - [PULC交通标志分类模型](docs/zh_CN/PULC/PULC_traffic_sign.md)
    - [PULC车辆属性识别模型](docs/zh_CN/PULC/PULC_vehicle_attribute.md)
W
weishengyu 已提交
84
    - [PULC有车/无车分类模型](docs/zh_CN/PULC/PULC_car_exists.md)
W
weishengyu 已提交
85 86 87
    - [PULC含文字图像方向分类模型](docs/zh_CN/PULC/PULC_text_image_orientation.md)
    - [PULC文本行方向分类模型](docs/zh_CN/PULC/PULC_textline_orientation.md)
    - [PULC语种分类模型](docs/zh_CN/PULC/PULC_language_classification.md)
C
cuicheng01 已提交
88
  - [模型训练](docs/zh_CN/PULC/PULC_train.md)
W
weishengyu 已提交
89 90 91
  - 推理部署
    - [基于python预测引擎推理](docs/zh_CN/inference_deployment/python_deploy.md#1)
    - [基于C++预测引擎推理](docs/zh_CN/inference_deployment/cpp_deploy.md)
H
HtdrogenSulfate 已提交
92
    - [服务化部署](docs/zh_CN/inference_deployment/classification_serving_deploy.md)
W
weishengyu 已提交
93 94 95 96 97
    - [端侧部署](docs/zh_CN/inference_deployment/paddle_lite_deploy.md)
    - [Paddle2ONNX模型转化与预测](deploy/paddle2onnx/readme.md)
  - [模型压缩](deploy/slim/README.md)
- PP系列骨干网络模型
  - [PP-HGNet](docs/zh_CN/models/PP-HGNet.md)
D
dyning 已提交
98
  - [PP-LCNetv2](docs/zh_CN/models/PP-LCNetV2.md)
W
weishengyu 已提交
99 100
  - [PP-LCNet](docs/zh_CN/models/PP-LCNet.md)
- [SSLD半监督知识蒸馏方案](docs/zh_CN/advanced_tutorials/ssld.md)
W
weishengyu 已提交
101
- 前沿算法
W
weishengyu 已提交
102 103
  - [骨干网络和预训练模型库](docs/zh_CN/algorithm_introduction/ImageNet_models.md)
  - [度量学习](docs/zh_CN/algorithm_introduction/metric_learning.md)
W
Wei Shengyu 已提交
104 105
  - [模型压缩](docs/zh_CN/algorithm_introduction/model_prune_quantization.md)
  - [模型蒸馏](docs/zh_CN/algorithm_introduction/knowledge_distillation.md)
W
weishengyu 已提交
106 107 108
  - [数据增强](docs/zh_CN/advanced_tutorials/DataAugmentation.md)
- [产业实用范例库](docs/zh_CN/samples)
- [30分钟快速体验图像分类](docs/zh_CN/quick_start/quick_start_classification_new_user.md)
W
weishengyu 已提交
109
- FAQ
W
weishengyu 已提交
110 111 112 113 114
  - [图像识别精选问题](docs/zh_CN/faq_series/faq_2021_s2.md)
  - [图像分类精选问题](docs/zh_CN/faq_series/faq_selected_30.md)
  - [图像分类FAQ第一季](docs/zh_CN/faq_series/faq_2020_s1.md)
  - [图像分类FAQ第二季](docs/zh_CN/faq_series/faq_2021_s1.md)
- [社区贡献指南](./docs/zh_CN/advanced_tutorials/how_to_contribute.md)
L
littletomatodonkey 已提交
115 116 117
- [许可证书](#许可证书)
- [贡献代码](#贡献代码)

littletomatodonkey's avatar
littletomatodonkey 已提交
118
<a name="图像识别系统介绍"></a>
D
dongshuilong 已提交
119

D
dongshuilong 已提交
120
## PP-ShiTuV2图像识别系统
L
littletomatodonkey 已提交
121 122

<div align="center">
W
weishengyu 已提交
123
<img src="./docs/images/structure.jpg"  width = "800" />
L
littletomatodonkey 已提交
124 125 126
</div>


D
dongshuilong 已提交
127
PP-ShiTuV2是一个实用的轻量级通用图像识别系统,主要由主体检测、特征学习和向量检索三个模块组成。该系统从骨干网络选择和调整、损失函数的选择、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型裁剪量化多个方面,采用多种策略,对各个模块的模型进行优化,PP-ShiTuV2相比V1而已,Recall1提升10+个点。更多细节请参考[PP-ShiTuV2详细介绍](./docs/zh_CN/PPShiTu/PPShiTuV2_introduction.md)
L
littletomatodonkey 已提交
128 129

<a name="识别效果展示"></a>
D
dongshuilong 已提交
130

D
dongshuilong 已提交
131
## PP-ShiTuV2图像识别系统效果展示
D
dongshuilong 已提交
132

W
weishengyu 已提交
133
- 瓶装饮料识别
D
dongshuilong 已提交
134

W
weishengyu 已提交
135 136 137
<div align="center">
<img src="docs/images/drink_demo.gif">
</div>
W
dbg  
weishengyu 已提交
138

D
dongshuilong 已提交
139

L
littletomatodonkey 已提交
140
- 商品识别
D
dongshuilong 已提交
141

L
littletomatodonkey 已提交
142
<div align="center">
L
LaraStuStu 已提交
143
<img src="https://user-images.githubusercontent.com/18028216/122769644-51604f80-d2d7-11eb-8290-c53b12a5c1f6.gif"  width = "400" />
L
littletomatodonkey 已提交
144 145
</div>

D
dongshuilong 已提交
146

L
littletomatodonkey 已提交
147
- 动漫人物识别
D
dongshuilong 已提交
148

L
littletomatodonkey 已提交
149
<div align="center">
L
LaraStuStu 已提交
150
<img src="https://user-images.githubusercontent.com/18028216/122769746-6b019700-d2d7-11eb-86df-f1d710999ba6.gif"  width = "400" />
L
littletomatodonkey 已提交
151 152
</div>

D
dongshuilong 已提交
153

L
littletomatodonkey 已提交
154
- logo识别
D
dongshuilong 已提交
155

L
littletomatodonkey 已提交
156
<div align="center">
L
LaraStuStu 已提交
157
<img src="https://user-images.githubusercontent.com/18028216/122769837-7fde2a80-d2d7-11eb-9b69-04140e9d785f.gif"  width = "400" />
L
littletomatodonkey 已提交
158 159
</div>

L
LaraStuStu 已提交
160

D
dongshuilong 已提交
161

L
littletomatodonkey 已提交
162
- 车辆识别
D
dongshuilong 已提交
163

L
littletomatodonkey 已提交
164
<div align="center">
L
LaraStuStu 已提交
165
<img src="https://user-images.githubusercontent.com/18028216/122769916-8ec4dd00-d2d7-11eb-8c60-42d89e25030c.gif"  width = "400" />
L
littletomatodonkey 已提交
166 167
</div>

L
LaraStuStu 已提交
168

D
dongshuilong 已提交
169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186

<a name="PULC超轻量图像分类方案"></a>

## PULC超轻量图像分类方案
<div align="center">
<img src="https://user-images.githubusercontent.com/19523330/173011854-b10fcd7a-b799-4dfd-a1cf-9504952a3c44.png"  width = "800" />
</div>
PULC融合了骨干网络、数据增广、蒸馏等多种前沿算法,可以自动训练得到轻量且高精度的图像分类模型。
PaddleClas提供了覆盖人、车、OCR场景九大常见任务的分类模型,CPU推理3ms,精度比肩SwinTransformer。

<a name="分类效果展示"></a>

## PULC实用图像分类模型效果展示
<div align="center">
<img src="docs/images/classification.gif">
</div>


L
littletomatodonkey 已提交
187 188 189 190 191 192 193 194 195
<a name="许可证书"></a>

## 许可证书
本项目的发布受<a href="https://github.com/PaddlePaddle/PaddleCLS/blob/master/LICENSE">Apache 2.0 license</a>许可认证。


<a name="贡献代码"></a>
## 贡献代码
我们非常欢迎你为PaddleClas贡献代码,也十分感谢你的反馈。
W
weishengyu 已提交
196 197
如果想为PaddleCLas贡献代码,可以参考[贡献指南](./docs/zh_CN/advanced_tutorials/how_to_contribute.md)

L
littletomatodonkey 已提交
198 199 200
- 非常感谢[nblib](https://github.com/nblib)修正了PaddleClas中RandErasing的数据增广配置文件。
- 非常感谢[chenpy228](https://github.com/chenpy228)修正了PaddleClas文档中的部分错别字。
- 非常感谢[jm12138](https://github.com/jm12138)为PaddleClas添加ViT,DeiT系列模型和RepVGG系列模型。