README_ch.md 12.6 KB
Newer Older
L
littletomatodonkey 已提交
1 2 3 4 5 6
简体中文 | [English](README_en.md)

# PaddleClas

## 简介

qq_25193841's avatar
qq_25193841 已提交
7
飞桨图像识别套件PaddleClas是飞桨为工业界和学术界所准备的一个图像识别和图像分类任务的工具集,助力使用者训练出更好的视觉模型和应用落地。
W
weishengyu 已提交
8

qq_25193841's avatar
qq_25193841 已提交
9 10 11
|             PP-ShiTuV2图像识别系统效果展示             |                PULC实用图像分类模型效果展示                 |
| :----------------------------------------------------: | :---------------------------------------------------------: |
| <img src="./docs/images/shituv2.gif"  width = "450" /> | <img src="./docs/images/class_simple.gif"  width = "600" /> |
W
weishengyu 已提交
12 13


qq_25193841's avatar
qq_25193841 已提交
14
## 📣 近期更新
L
lilithzhou 已提交
15

qq_25193841's avatar
qq_25193841 已提交
16
- **💥 直播预告:11.1-11.3日每晚8点半**,PaddleClas研发团队详解PP-ShituV2优化策略与真实产业应用。微信扫描下方二维码,关注公众号并填写问卷后进入官方交流群,获取直播链接与20G重磅图像分类学习大礼包(内含20+数据集、4个垂类模型、70+前沿论文集合)
D
dongshuilong 已提交
17

D
dyning 已提交
18
<div align="center">
qq_25193841's avatar
qq_25193841 已提交
19
    <img src="https://user-images.githubusercontent.com/11568925/189877049-d17ddcea-22d2-44ab-91fe-36d12af3add8.png" width = "150" height = "150"/>
D
dyning 已提交
20
</div>
L
lilithzhou 已提交
21 22


qq_25193841's avatar
qq_25193841 已提交
23
- 🔥️ 2022.9.14 发布**商超零售新革命-生鲜智能结算产业应用**范例
L
lilithzhou 已提交
24

qq_25193841's avatar
qq_25193841 已提交
25 26 27 28
- **🔥️ 2022.9.13 发布超轻量图像识别系统[PP-ShiTuV2](docs/zh_CN/models/PP-ShiTu/README.md):**
  - recall1精度提升8个点,覆盖商品识别、垃圾分类、航拍场景等[20+识别场景](docs/zh_CN/deployment/PP-ShiTu/application_scenarios.md)
  - 新增[库管理工具](./deploy/shitu_index_manager/)[Android Demo](./docs/zh_CN/quick_start/quick_start_recognition.md)全新体验。
  
D
dongshuilong 已提交
29
- 2022.9.4 新增[生鲜产品自主结算范例库](./docs/zh_CN/samples/Fresh_Food_Recogniiton/README.md),具体内容可以在AI Studio上体验。
T
Tingquan Gao 已提交
30
- 2022.6.15 发布[PULC超轻量图像分类实用方案](docs/zh_CN/training/PULC.md),CPU推理3ms,精度比肩SwinTransformer,覆盖人、车、OCR场景九大常见任务。
D
dongshuilong 已提交
31
- 2022.5.23 新增[人员出入管理范例库](https://aistudio.baidu.com/aistudio/projectdetail/4094475),具体内容可以在 AI Studio 上体验。
T
Tingquan Gao 已提交
32 33
- 2022.5.20 上线[PP-HGNet](./docs/zh_CN/models/ImageNet1k/PP-HGNet.md), [PP-LCNetv2](./docs/zh_CN/models/ImageNet1k/PP-LCNetV2.md)
- [more](docs/zh_CN/version_history.md)
L
littletomatodonkey 已提交
34 35


qq_25193841's avatar
qq_25193841 已提交
36
## 🌟 特性
L
littletomatodonkey 已提交
37

qq_25193841's avatar
qq_25193841 已提交
38
PaddleClas支持多种前沿图像分类、识别相关算法,发布产业级特色骨干网络[PP-HGNet](docs/zh_CN/models/ImageNet1k/PP-HGNet.md)[PP-LCNetv2](docs/zh_CN/models/ImageNet1k/PP-LCNetV2.md)[PP-LCNet](docs/zh_CN/models/ImageNet1k/PP-LCNet.md)[SSLD半监督知识蒸馏方案](docs/zh_CN/training/advanced/ssld.md)等模型,在此基础上打造[PULC超轻量图像分类方案](docs/zh_CN/quick_start/PULC.md)[PP-ShiTu图像识别系统](./docs/zh_CN/quick_start/quick_start_recognition.md)
L
littletomatodonkey 已提交
39 40

<div align="center">
qq_25193841's avatar
qq_25193841 已提交
41
  <img src="https://user-images.githubusercontent.com/11568925/189267545-7a6eefa0-b4fc-4ed0-ae9d-7c6d53f59798.png"/>
L
littletomatodonkey 已提交
42
</div>
qq_25193841's avatar
qq_25193841 已提交
43
> 上述内容的使用方法建议从文档教程中的快速开始体验
L
littletomatodonkey 已提交
44

qq_25193841's avatar
qq_25193841 已提交
45
## 👫 开源社区
D
dongshuilong 已提交
46

qq_25193841's avatar
qq_25193841 已提交
47 48 49 50 51
* **📑项目合作:** 如果您是企业开发者且有明确的图像分类应用需求,填写[问卷](https://paddle.wjx.cn/vm/hnGOjfn.aspx# )后可免费与官方团队展开不同层次的合作。
* **👫加入社区:** 微信扫描二维码并填写问卷之后,加入交流群领取20G重磅图像分类学习大礼包,内含
  * **20+场景数据库**,包括各类商品、动植物、航拍图像等数据集
  * 场景应用**模型集合**:包括人员出入管理、生鲜品识别、商品识别等
  * **50+前沿图像分类与识别论文**、历次发版课程视频、PPT与优质社区项目等
L
littletomatodonkey 已提交
52

W
dbg  
weishengyu 已提交
53

qq_25193841's avatar
qq_25193841 已提交
54 55 56
<div align="center">
  <img src="https://user-images.githubusercontent.com/45199522/173483779-2332f990-4941-4f8d-baee-69b62035fc31.png" width = "150" height = "150"/>
</div>
L
littletomatodonkey 已提交
57

qq_25193841's avatar
qq_25193841 已提交
58 59 60 61 62
## ⚡ 快速开始

- PULC超轻量图像分类方案快速体验:[点击这里](docs/zh_CN/quick_start/PULC.md)
- PP-ShiTu图像识别快速体验:[点击这里](./docs/zh_CN/quick_start/quick_start_recognition.md)
- PP-ShiTuV2 Android Demo APP,可扫描如下二维码,下载体验
D
dongshuilong 已提交
63

D
dongshuilong 已提交
64
<div align="center">
qq_25193841's avatar
qq_25193841 已提交
65
<img src="./docs/images/quick_start/android_demo/PPShiTu_qrcode.png"  width = "170" height = "170" />
D
dongshuilong 已提交
66 67
</div>

qq_25193841's avatar
qq_25193841 已提交
68 69
## 🛠️ PP系列模型列表(更新中)

qq_25193841's avatar
qq_25193841 已提交
70 71 72 73 74 75
| 模型简介                    | 应用场景                         | 模型链接                                                     |
| --------------------------- | -------------------------------- | ------------------------------------------------------------ |
| PULC 超轻量图像分类方案     | 固定图像类别分类                 | 人体相关:属性分类(性别\|年龄\|朝向\|穿着\|随身物品)、有/无人分类<br />车辆相关:车辆分类(颜色\|类型)、有/无车分类、232种交通标志<br />文字相关:整图4向分类、文本行正反向分类、10种语种分类 |
| PP-ShituV2 轻量图像识别系统 | 场景数据类别频繁变动、类别数据多 | 检测网络、识别网络、图像检索库                               |
| PP-LCNet 轻量骨干网络       | 移动端&服务端                    | 不同版本xxx                                                  |
| PP-HGNet 高精度骨干网络     | 移动端&服务端                    | 不同版本xxx                                                  |
D
dongshuilong 已提交
76

qq_25193841's avatar
qq_25193841 已提交
77
### 产业范例
L
lilithzhou 已提交
78

qq_25193841's avatar
qq_25193841 已提交
79
- 基于PP-ShiTuV2的生鲜品自助结算: [点击这里](./docs/zh_CN/samples/Fresh_Food_Recogniiton/README.md)
D
dongshuilong 已提交
80
- 基于PULC人员出入视频管理: [点击这里](./docs/zh_CN/samples/Personnel_Access/README.md)
qq_25193841's avatar
qq_25193841 已提交
81
- 基于PP-ShiTu 的智慧商超商品识别:[点击这里](./docs/zh_CN/samples/Goods_Recognition/README.md)
D
dongshuilong 已提交
82
- 基于PP-ShiTu电梯内电瓶车入室识别:[点击这里](./docs/zh_CN/samples//Electromobile_In_Elevator_Detection/README.md)
L
lilithzhou 已提交
83

qq_25193841's avatar
qq_25193841 已提交
84
## 📖 文档教程
T
Tingquan Gao 已提交
85 86
- [环境准备](docs/zh_CN/installation.md)
- [PP-ShiTuV2图像识别系统介绍](docs/zh_CN/models/PP-ShiTu/README.md)
D
dongshuilong 已提交
87
  - [图像识别快速体验](docs/zh_CN/quick_start/quick_start_recognition.md)
T
Tingquan Gao 已提交
88
  - [20+应用场景库](docs/zh_CN/deployment/PP-ShiTu/application_scenarios.md)
D
dongshuilong 已提交
89
  - 子模块算法介绍及模型训练
T
Tingquan Gao 已提交
90 91 92 93
    - [主体检测](docs/zh_CN/training/PP-ShiTu/mainbody_detection.md)
    - [特征提取模型](docs/zh_CN/training/PP-ShiTu/feature_extraction.md)
    - [向量检索](docs/zh_CN/deployment/PP-ShiTu/vector_search.md)
    - [哈希编码](docs/zh_CN/training/PP-ShiTu/deep_hashing.md)
D
dongshuilong 已提交
94
  - PipeLine 推理部署
T
Tingquan Gao 已提交
95
    - [基于python预测引擎推理](docs/zh_CN/deployment/image_classification/python.md#2)
D
dongshuilong 已提交
96
    - [基于C++预测引擎推理](deploy/cpp_shitu/readme.md)
T
Tingquan Gao 已提交
97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112
    - [服务化部署](docs/zh_CN/deployment/PP-ShiTu/paddle_serving.md)
    - [端侧部署](docs/zh_CN/deployment/PP-ShiTu/paddle_lite.md)
    - [库管理工具](docs/zh_CN/deployment/PP-ShiTu/gallery_manager.md)
- [PULC超轻量图像分类实用方案](docs/zh_CN/training/PULC.md)
  - [超轻量图像分类快速体验](docs/zh_CN/quick_start/PULC.md)
  - [超轻量图像分类模型库](docs/zh_CN/models/PULC/model_list.md)
    - [PULC有人/无人分类模型](docs/zh_CN/models/PULC/PULC_person_exists.md)
    - [PULC人体属性识别模型](docs/zh_CN/models/PULC/PULC_person_attribute.md)
    - [PULC佩戴安全帽分类模型](docs/zh_CN/models/PULC/PULC_safety_helmet.md)
    - [PULC交通标志分类模型](docs/zh_CN/models/PULC/PULC_traffic_sign.md)
    - [PULC车辆属性识别模型](docs/zh_CN/models/PULC/PULC_vehicle_attribute.md)
    - [PULC有车/无车分类模型](docs/zh_CN/models/PULC/PULC_car_exists.md)
    - [PULC含文字图像方向分类模型](docs/zh_CN/models/PULC/PULC_text_image_orientation.md)
    - [PULC文本行方向分类模型](docs/zh_CN/models/PULC/PULC_textline_orientation.md)
    - [PULC语种分类模型](docs/zh_CN/models/PULC/PULC_language_classification.md)
  - [模型训练](docs/zh_CN/training/PULC.md)
W
weishengyu 已提交
113
  - 推理部署
T
Tingquan Gao 已提交
114 115 116 117 118
    - [基于python预测引擎推理](docs/zh_CN/deployment/image_classification/python.md#1)
    - [基于C++预测引擎推理](docs/zh_CN/deployment/image_classification/cpp/linux.md)
    - [服务化部署](docs/zh_CN/deployment/image_classification/paddle_serving.md)
    - [端侧部署](docs/zh_CN/deployment/image_classification/paddle_lite.md)
    - [Paddle2ONNX模型转化与预测](docs/zh_CN/deployment/image_classification/paddle2onnx.md)
W
weishengyu 已提交
119 120
  - [模型压缩](deploy/slim/README.md)
- PP系列骨干网络模型
T
Tingquan Gao 已提交
121 122 123 124
  - [PP-HGNet](docs/zh_CN/models/ImageNet1k/PP-HGNet.md)
  - [PP-LCNetv2](docs/zh_CN/models/ImageNet1k/PP-LCNetV2.md)
  - [PP-LCNet](docs/zh_CN/models/ImageNet1k/PP-LCNet.md)
- [SSLD半监督知识蒸馏方案](docs/zh_CN/training/advanced/ssld.md)
W
weishengyu 已提交
125
- 前沿算法
T
Tingquan Gao 已提交
126
  - [骨干网络和预训练模型库](docs/zh_CN/models/ImageNet1k/model_list.md)
W
weishengyu 已提交
127
  - [度量学习](docs/zh_CN/algorithm_introduction/metric_learning.md)
T
Tingquan Gao 已提交
128 129
    - [ReID](./docs/zh_CN/algorithm_introduction/ReID.md)
  - [模型压缩](docs/zh_CN/algorithm_introduction/prune_quantization.md)
130 131
  - [模型蒸馏](./docs/zh_CN/training/advanced/knowledge_distillation.md)
  - [数据增强](docs/zh_CN/training/config_description/data_augmentation.md)
W
weishengyu 已提交
132 133
- [产业实用范例库](docs/zh_CN/samples)
- [30分钟快速体验图像分类](docs/zh_CN/quick_start/quick_start_classification_new_user.md)
W
weishengyu 已提交
134
- FAQ
T
Tingquan Gao 已提交
135 136 137 138 139 140
  - [图像识别精选问题](docs/zh_CN/FAQ/faq_2021_s2.md)
  - [图像分类精选问题](docs/zh_CN/FAQ/faq_selected_30.md)
  - [图像分类FAQ第一季](docs/zh_CN/FAQ/faq_2020_s1.md)
  - [图像分类FAQ第二季](docs/zh_CN/FAQ/faq_2021_s1.md)
  - [图像分类FAQ第三季](docs/zh_CN/FAQ/faq_2022_s1.md)
- [社区贡献指南](docs/zh_CN/community/how_to_contribute.md)
L
littletomatodonkey 已提交
141 142 143
- [许可证书](#许可证书)
- [贡献代码](#贡献代码)

littletomatodonkey's avatar
littletomatodonkey 已提交
144
<a name="图像识别系统介绍"></a>
D
dongshuilong 已提交
145

D
dongshuilong 已提交
146
## PP-ShiTuV2图像识别系统
L
littletomatodonkey 已提交
147 148

<div align="center">
W
weishengyu 已提交
149
<img src="./docs/images/structure.jpg"  width = "800" />
L
littletomatodonkey 已提交
150 151 152
</div>


T
Tingquan Gao 已提交
153
PP-ShiTuV2是一个实用的轻量级通用图像识别系统,主要由主体检测、特征学习和向量检索三个模块组成。该系统从骨干网络选择和调整、损失函数的选择、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型裁剪量化多个方面,采用多种策略,对各个模块的模型进行优化,PP-ShiTuV2相比V1,Recall1提升近8个点。更多细节请参考[PP-ShiTuV2详细介绍](docs/zh_CN/models/PP-ShiTu/README.md)
L
littletomatodonkey 已提交
154 155

<a name="识别效果展示"></a>
D
dongshuilong 已提交
156

D
dongshuilong 已提交
157
## PP-ShiTuV2图像识别系统效果展示
D
dongshuilong 已提交
158

W
weishengyu 已提交
159
- 瓶装饮料识别
D
dongshuilong 已提交
160

W
weishengyu 已提交
161 162 163
<div align="center">
<img src="docs/images/drink_demo.gif">
</div>
W
dbg  
weishengyu 已提交
164

D
dongshuilong 已提交
165

L
littletomatodonkey 已提交
166
- 商品识别
D
dongshuilong 已提交
167

L
littletomatodonkey 已提交
168
<div align="center">
L
LaraStuStu 已提交
169
<img src="https://user-images.githubusercontent.com/18028216/122769644-51604f80-d2d7-11eb-8290-c53b12a5c1f6.gif"  width = "400" />
L
littletomatodonkey 已提交
170 171
</div>

D
dongshuilong 已提交
172

L
littletomatodonkey 已提交
173
- 动漫人物识别
D
dongshuilong 已提交
174

L
littletomatodonkey 已提交
175
<div align="center">
L
LaraStuStu 已提交
176
<img src="https://user-images.githubusercontent.com/18028216/122769746-6b019700-d2d7-11eb-86df-f1d710999ba6.gif"  width = "400" />
L
littletomatodonkey 已提交
177 178
</div>

D
dongshuilong 已提交
179

L
littletomatodonkey 已提交
180
- logo识别
D
dongshuilong 已提交
181

L
littletomatodonkey 已提交
182
<div align="center">
L
LaraStuStu 已提交
183
<img src="https://user-images.githubusercontent.com/18028216/122769837-7fde2a80-d2d7-11eb-9b69-04140e9d785f.gif"  width = "400" />
L
littletomatodonkey 已提交
184 185
</div>

L
LaraStuStu 已提交
186

D
dongshuilong 已提交
187

L
littletomatodonkey 已提交
188
- 车辆识别
D
dongshuilong 已提交
189

L
littletomatodonkey 已提交
190
<div align="center">
L
LaraStuStu 已提交
191
<img src="https://user-images.githubusercontent.com/18028216/122769916-8ec4dd00-d2d7-11eb-8c60-42d89e25030c.gif"  width = "400" />
L
littletomatodonkey 已提交
192 193
</div>

L
LaraStuStu 已提交
194

D
dongshuilong 已提交
195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212

<a name="PULC超轻量图像分类方案"></a>

## PULC超轻量图像分类方案
<div align="center">
<img src="https://user-images.githubusercontent.com/19523330/173011854-b10fcd7a-b799-4dfd-a1cf-9504952a3c44.png"  width = "800" />
</div>
PULC融合了骨干网络、数据增广、蒸馏等多种前沿算法,可以自动训练得到轻量且高精度的图像分类模型。
PaddleClas提供了覆盖人、车、OCR场景九大常见任务的分类模型,CPU推理3ms,精度比肩SwinTransformer。

<a name="分类效果展示"></a>

## PULC实用图像分类模型效果展示
<div align="center">
<img src="docs/images/classification.gif">
</div>


L
littletomatodonkey 已提交
213 214 215 216 217 218 219 220 221
<a name="许可证书"></a>

## 许可证书
本项目的发布受<a href="https://github.com/PaddlePaddle/PaddleCLS/blob/master/LICENSE">Apache 2.0 license</a>许可认证。


<a name="贡献代码"></a>
## 贡献代码
我们非常欢迎你为PaddleClas贡献代码,也十分感谢你的反馈。
T
Tingquan Gao 已提交
222
如果想为PaddleCLas贡献代码,可以参考[贡献指南](docs/zh_CN/community/how_to_contribute.md)
W
weishengyu 已提交
223

L
littletomatodonkey 已提交
224 225 226
- 非常感谢[nblib](https://github.com/nblib)修正了PaddleClas中RandErasing的数据增广配置文件。
- 非常感谢[chenpy228](https://github.com/chenpy228)修正了PaddleClas文档中的部分错别字。
- 非常感谢[jm12138](https://github.com/jm12138)为PaddleClas添加ViT,DeiT系列模型和RepVGG系列模型。