简体中文 | [English](README_en.md) # PaddleClas ## 简介 飞桨图像识别套件PaddleClas是飞桨为工业界和学术界所准备的一个图像识别任务的工具集,助力使用者训练出更好的视觉模型和应用落地。 **近期更新** - 🔥️ 2022.5.26 [飞桨产业实践范例直播课](http://aglc.cn/v-c4FAR),解读**超轻量重点区域人员出入管理方案**,欢迎报名来交流。
- 2022.5.23 新增[人员出入管理范例库](https://aistudio.baidu.com/aistudio/projectdetail/4094475),具体内容可以在 AI Stuio 上体验。 - 2022.5.20 上线[PP-HGNet](./docs/zh_CN/models/PP-HGNet.md), [PP-LCNet v2](./docs/zh_CN/models/PP-LCNetV2.md) - 2022.4.21 新增 CVPR2022 oral论文 [MixFormer](https://arxiv.org/pdf/2204.02557.pdf) 相关[代码](https://github.com/PaddlePaddle/PaddleClas/pull/1820/files)。 - 2022.1.27 全面升级文档;新增[PaddleServing C++ pipeline部署方式](./deploy/paddleserving)和[18M图像识别安卓部署Demo](./deploy/lite_shitu)。 - 2021.11.1 发布[PP-ShiTu技术报告](https://arxiv.org/pdf/2111.00775.pdf),新增饮料识别demo - 2021.10.23 发布轻量级图像识别系统PP-ShiTu,CPU上0.2s即可完成在10w+库的图像识别。 [点击这里](./docs/zh_CN/quick_start/quick_start_recognition.md)立即体验 - 2021.09.17 发布PP-LCNet系列超轻量骨干网络模型, 在Intel CPU上,单张图像预测速度约5ms,ImageNet-1K数据集上Top1识别准确率达到80.82%,超越ResNet152的模型效果。PP-LCNet的介绍可以参考[论文](https://arxiv.org/pdf/2109.15099.pdf), 或者[PP-LCNet模型介绍](docs/zh_CN/models/PP-LCNet.md),相关指标和预训练权重可以从 [这里](docs/zh_CN/algorithm_introduction/ImageNet_models.md)下载。 - [more](./docs/zh_CN/others/update_history.md) ## 特性 - PP-ShiTu轻量图像识别系统:集成了目标检测、特征学习、图像检索等模块,广泛适用于各类图像识别任务。cpu上0.2s即可完成在10w+库的图像识别。 - PP-LCNet轻量级CPU骨干网络:专门为CPU设备打造轻量级骨干网络,速度、精度均远超竞品。 - 丰富的预训练模型库:提供了36个系列共175个ImageNet预训练模型,其中7个精选系列模型支持结构快速修改。 - 全面易用的特征学习组件:集成arcmargin, triplet loss等12度量学习方法,通过配置文件即可随意组合切换。 - SSLD知识蒸馏:14个分类预训练模型,精度普遍提升3%以上;其中ResNet50_vd模型在ImageNet-1k数据集上的Top-1精度达到了84.0%, Res2Net200_vd预训练模型Top-1精度高达85.1%。
## 欢迎加入技术交流群 * 您可以扫描下面的QQ/微信二维码(添加小助手微信并回复“C”),加入PaddleClas微信交流群,获得更高效的问题答疑,与各行各业开发者充分交流,期待您的加入。
## 快速体验 PP-ShiTu图像识别快速体验:[点击这里](./docs/zh_CN/quick_start/quick_start_recognition.md) ## 文档教程 - [环境准备]() - [PULC超轻量图像分类实用方案]() - [超轻量图像分类快速体验 (@崔程)]() - [超轻量图像分类模型库](包含benchmark @崔程) - xx - [方案介绍和模型训练]() - [推理部署](@水龙) - 基于python预测引擎推理 - 基于C++预测引擎推理 - 服务化部署 - 端侧部署 - Paddle2ONNX模型转化与预测 - [模型压缩](@崔程) - [PP-ShiTu图像识别系统介绍](#图像识别系统介绍) - 图像识别快速体验 - 模块介绍 - [主体检测](./docs/zh_CN/image_recognition_pipeline/mainbody_detection.md) - [特征提取模型](./docs/zh_CN/image_recognition_pipeline/feature_extraction.md) - [向量检索](./docs/zh_CN/image_recognition_pipeline/vector_search.md) - 哈希编码 - 模型训练(包含数据集格式说明等) - 推理部署 - 基于python预测引擎推理 - 基于C++预测引擎推理 - 服务化部署 - 端侧部署 - Paddle2ONNX模型转化与预测 - 模型压缩 - 模型量化 - 模型裁剪 - [骨干网络和预训练模型库](./docs/zh_CN/algorithm_introduction/ImageNet_models.md) - PP系列骨干网络模型(包括算法介绍,使用,训推一体链接等)(@崔程) - PP-HGNet - PP-LCNet v2 - PP-LCNet - SSLD半监督知识蒸馏方案 (@若愚) - SSLD算法简介 - 预训练模型库 - 使用方法(?) - 前沿算法 - 骨干网络和预训练模型库 (@崔程) - 服务端CNN模型库 - 移动端CNN模型库 - Vision Transformer模型库 - 度量学习(arcmargin等算法)(@水龙) - ReID (@水龙) - 向量检索 (@水龙) - 哈希特征 (@水龙) - 模型蒸馏 (@若愚) - 数据增强 (@崔程) - 产业实用范例库 (@胜禹) - 30分钟快速体验图像分类(原尝鲜版)(@崔程) - FAQ - [图像识别精选问题](docs/zh_CN/faq_series/faq_2021_s2.md) - [图像分类精选问题](docs/zh_CN/faq_series/faq_selected_30.md) - [图像分类FAQ第一季](docs/zh_CN/faq_series/faq_2020_s1.md) - [图像分类FAQ第二季](docs/zh_CN/faq_series/faq_2021_s1.md) - [PaddleClas结构解析](./docs/zh_CN/advanced_tutorials/code_overview.md) - [社区贡献指南](./docs/zh_CN/advanced_tutorials/how_to_contribute.md) - [许可证书](#许可证书) - [贡献代码](#贡献代码) ## PP-ShiTu图像识别系统介绍
PP-ShiTu是一个实用的轻量级通用图像识别系统,主要由主体检测、特征学习和向量检索三个模块组成。该系统从骨干网络选择和调整、损失函数的选择、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型裁剪量化8个方面,采用多种策略,对各个模块的模型进行优化,最终得到在CPU上仅0.2s即可完成10w+库的图像识别的系统。更多细节请参考[PP-ShiTu技术方案](https://arxiv.org/pdf/2111.00775.pdf)。 ## PP-ShiTu图像识别系统效果展示 - 瓶装饮料识别
- 商品识别
- 动漫人物识别
- logo识别
- 车辆识别
## 许可证书 本项目的发布受Apache 2.0 license许可认证。 ## 贡献代码 我们非常欢迎你为PaddleClas贡献代码,也十分感谢你的反馈。 如果想为PaddleCLas贡献代码,可以参考[贡献指南](./docs/zh_CN/advanced_tutorials/how_to_contribute.md)。 - 非常感谢[nblib](https://github.com/nblib)修正了PaddleClas中RandErasing的数据增广配置文件。 - 非常感谢[chenpy228](https://github.com/chenpy228)修正了PaddleClas文档中的部分错别字。 - 非常感谢[jm12138](https://github.com/jm12138)为PaddleClas添加ViT,DeiT系列模型和RepVGG系列模型。