README_cn.md 11.5 KB
Newer Older
W
wangguanzhong 已提交
1 2 3 4
简体中文 | [English](README_en.md)

# PaddleDetection

K
Kaipeng Deng 已提交
5 6
# 产品动态
- 2021.11.03: 发布[release/2.3版本](https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.3),发布**轻量级检测特色模型**[PP-PicoDet](configs/picodet),发布**轻量级关键点特色模型**[PP-TinyPose](configs/keypoint/tiny_pose)。新增[Swin Transformer](configs/faster_rcnn)[TOOD](configs/tood)[GFL](configs/gfl)目标检测模型。发布[Sniper](configs/sniper)小目标检测优化模型,发布针对EdgeBoard优化[PP-YOLO-EB](configs/ppyolo)模型。新增轻量化关键点模型[Lite HRNet](configs/keypoint)关键点模型并支持Paddle Lite部署。
K
Kaipeng Deng 已提交
7
- 2021.08.10: 发布[release/2.2版本](https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.2),发布Transformer检测系列模型,包括[DETR](configs/detr), [Deformable DETR](configs/deformable_detr), [Sparse RCNN](configs/sparse_rcnn)。新增Dark HRNet关键点模型和MPII数据集[关键点模型](configs/keypoint),新增[人头](configs/mot/headtracking21)[车辆](configs/mot/vehicle)跟踪垂类模型。
K
Kaipeng Deng 已提交
8
- 2021.05.20: 发布[release/2.1版本](https://github.com/PaddlePaddle/PaddleDetection/tree/release/2.1),新增[关键点检测](configs/keypoint),模型包括HigherHRNet,HRNet。新增[多目标跟踪](configs/mot)能力,模型包括DeepSORT,JDE,FairMOT。发布PPYOLO系列模型压缩模型,新增[ONNX模型导出教程](deploy/EXPORT_ONNX_MODEL.md)
W
wangguanzhong 已提交
9 10 11

# 简介

K
Kaipeng Deng 已提交
12
PaddleDetection为基于飞桨PaddlePaddle的端到端目标检测套件,提供多种主流目标检测、实例分割、跟踪、关键点检测算法,配置化的网络模块组件、数据增强策略、损失函数等,推出多种服务器端和移动端工业级SOTA模型,并集成了模型压缩和跨平台高性能部署能力,帮助开发者更快更好完成端到端全开发流程。
W
wangguanzhong 已提交
13

K
Kaipeng Deng 已提交
14
### PaddleDetection提供了目标检测、实例分割、多目标跟踪、关键点检测等多种能力
W
wangguanzhong 已提交
15

K
Kaipeng Deng 已提交
16 17
<div width="1000" align="center">
  <img src="docs/images/ppdet.gif"/>
W
wangguanzhong 已提交
18 19 20 21 22 23 24 25 26 27 28 29 30
</div>


### 特性

- **模型丰富**: 包含**目标检测****实例分割****人脸检测****100+个预训练模型**,涵盖多种**全球竞赛冠军**方案
- **使用简洁**:模块化设计,解耦各个网络组件,开发者轻松搭建、试用各种检测模型及优化策略,快速得到高性能、定制化的算法。
- **端到端打通**: 从数据增强、组网、训练、压缩、部署端到端打通,并完备支持**云端**/**边缘端**多架构、多设备部署。
- **高性能**: 基于飞桨的高性能内核,模型训练速度及显存占用优势明显。支持FP16训练, 支持多机训练。


### 套件结构概览

K
Kaipeng Deng 已提交
31
<table align="center">
W
wangguanzhong 已提交
32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48
  <tbody>
    <tr align="center" valign="bottom">
      <td>
        <b>Architectures</b>
      </td>
      <td>
        <b>Backbones</b>
      </td>
      <td>
        <b>Components</b>
      </td>
      <td>
        <b>Data Augmentation</b>
      </td>
    </tr>
    <tr valign="top">
      <td>
49 50
        <ul>
          <li><b>Object Detection</b></li>
W
wangguanzhong 已提交
51 52 53 54 55 56 57 58 59 60
          <ul>
            <li>Faster RCNN</li>
            <li>FPN</li>
            <li>Cascade-RCNN</li>
            <li>Libra RCNN</li>
            <li>Hybrid Task RCNN</li>
            <li>PSS-Det</li>
            <li>RetinaNet</li>
            <li>YOLOv3</li>
            <li>YOLOv4</li>  
61 62
            <li>PP-YOLOv1/v2</li>
            <li>PP-YOLO-Tiny</li>
W
wangguanzhong 已提交
63 64 65 66
            <li>SSD</li>
            <li>CornerNet-Squeeze</li>
            <li>FCOS</li>  
            <li>TTFNet</li>
67 68 69 70 71
            <li>PP-PicoDet</li>
            <li>DETR</li>
            <li>Deformable DETR</li>
            <li>Swin Transformer</li>
            <li>Sparse RCNN</li>
W
wangguanzhong 已提交
72
        </ul>
73
        <li><b>Instance Segmentation</b></li>
W
wangguanzhong 已提交
74
        <ul>
75 76
            <li>Mask RCNN</li>
            <li>SOLOv2</li>
W
wangguanzhong 已提交
77
        </ul>
78
        <li><b>Face Detection</b></li>
K
Kaipeng Deng 已提交
79
        <ul>
80 81 82
            <li>FaceBoxes</li>
            <li>BlazeFace</li>
            <li>BlazeFace-NAS</li>
K
Kaipeng Deng 已提交
83
        </ul>
84
        <li><b>Multi-Object-Tracking</b></li>
K
Kaipeng Deng 已提交
85
        <ul>
86 87 88
            <li>JDE</li>
            <li>FairMOT</li>
            <li>DeepSort</li>
K
Kaipeng Deng 已提交
89
        </ul>
90
        <li><b>KeyPoint-Detection</b></li>
K
Kaipeng Deng 已提交
91
        <ul>
92 93
            <li>HRNet</li>
            <li>HigherHRNet</li>
K
Kaipeng Deng 已提交
94
        </ul>
95
      </ul>
W
wangguanzhong 已提交
96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112
      </td>
      <td>
        <ul>
          <li>ResNet(&vd)</li>
          <li>ResNeXt(&vd)</li>
          <li>SENet</li>
          <li>Res2Net</li>
          <li>HRNet</li>
          <li>Hourglass</li>
          <li>CBNet</li>
          <li>GCNet</li>
          <li>DarkNet</li>
          <li>CSPDarkNet</li>
          <li>VGG</li>
          <li>MobileNetv1/v3</li>  
          <li>GhostNet</li>
          <li>Efficientnet</li>  
K
Kaipeng Deng 已提交
113
          <li>BlazeNet</li>  
W
wangguanzhong 已提交
114 115 116 117 118 119 120 121 122 123 124
        </ul>
      </td>
      <td>
        <ul><li><b>Common</b></li>
          <ul>
            <li>Sync-BN</li>
            <li>Group Norm</li>
            <li>DCNv2</li>
            <li>Non-local</li>
          </ul>  
        </ul>
K
Kaipeng Deng 已提交
125 126 127 128 129
        <ul><li><b>KeyPoint</b></li>
          <ul>
            <li>DarkPose</li>
          </ul>  
        </ul>
W
wangguanzhong 已提交
130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160
        <ul><li><b>FPN</b></li>
          <ul>
            <li>BiFPN</li>
            <li>BFP</li>  
            <li>HRFPN</li>
            <li>ACFPN</li>
          </ul>  
        </ul>  
        <ul><li><b>Loss</b></li>
          <ul>
            <li>Smooth-L1</li>
            <li>GIoU/DIoU/CIoU</li>  
            <li>IoUAware</li>
          </ul>  
        </ul>  
        <ul><li><b>Post-processing</b></li>
          <ul>
            <li>SoftNMS</li>
            <li>MatrixNMS</li>  
          </ul>  
        </ul>
        <ul><li><b>Speed</b></li>
          <ul>
            <li>FP16 training</li>
            <li>Multi-machine training </li>  
          </ul>  
        </ul>  
      </td>
      <td>
        <ul>
          <li>Resize</li>  
K
Kaipeng Deng 已提交
161
          <li>Lighting</li>  
W
wangguanzhong 已提交
162 163 164 165 166 167
          <li>Flipping</li>  
          <li>Expand</li>
          <li>Crop</li>
          <li>Color Distort</li>  
          <li>Random Erasing</li>  
          <li>Mixup </li>
K
Kaipeng Deng 已提交
168
          <li>Mosaic</li>
W
wangguanzhong 已提交
169 170 171
          <li>Cutmix </li>
          <li>Grid Mask</li>
          <li>Auto Augment</li>  
K
Kaipeng Deng 已提交
172
          <li>Random Perspective</li>  
W
wangguanzhong 已提交
173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194
        </ul>  
      </td>  
    </tr>


</td>
    </tr>
  </tbody>
</table>

#### 模型性能概览

各模型结构和骨干网络的代表模型在COCO数据集上精度mAP和单卡Tesla V100上预测速度(FPS)对比图。

<div align="center">
  <img src="docs/images/fps_map.png" />
</div>

**说明:**

- `CBResNet``Cascade-Faster-RCNN-CBResNet200vd-FPN`模型,COCO数据集mAP高达53.3%
- `Cascade-Faster-RCNN``Cascade-Faster-RCNN-ResNet50vd-DCN`,PaddleDetection将其优化到COCO数据mAP为47.8%时推理速度为20FPS
195
- `PP-YOLO`在COCO数据集精度45.9%,Tesla V100预测速度72.9FPS,精度速度均优于[YOLOv4](https://arxiv.org/abs/2004.10934)
W
wangguanzhong 已提交
196
- `PP-YOLO v2`是对`PP-YOLO`模型的进一步优化,在COCO数据集精度49.5%,Tesla V100预测速度68.9FPS
W
wangguanzhong 已提交
197 198
- 图中模型均可在[模型库](#模型库)中获取

K
Kaipeng Deng 已提交
199 200 201 202 203 204 205 206 207 208
各移动端模型在COCO数据集上精度mAP和高通骁龙865处理器上预测速度(FPS)对比图。

<div align="center">
  <img src="docs/images/mobile_fps_map.png" width=600/>
</div>

**说明:**
- 测试数据均使用高通骁龙865(4\*A77 + 4\*A55)处理器batch size为1, 开启4线程测试,测试使用NCNN预测库,测试脚本见[MobileDetBenchmark](https://github.com/JiweiMaster/MobileDetBenchmark)
- [PP-PicoDet](configs/picodet)[PP-YOLO-Tiny](configs/ppyolo)为PaddleDetection自研模型,其余模型PaddleDetection暂未提供

W
wangguanzhong 已提交
209 210 211 212 213
## 文档教程

### 入门教程

- [安装说明](docs/tutorials/INSTALL_cn.md)
214
- [数据准备](docs/tutorials/PrepareDataSet.md)
215
- [30分钟上手PaddleDetecion](docs/tutorials/GETTING_STARTED_cn.md)
Y
YixinKristy 已提交
216
- [FAQ/常见问题汇总](docs/tutorials/FAQ)
Y
yzl19940819 已提交
217

W
wangguanzhong 已提交
218 219 220

### 进阶教程

221
- 参数配置
W
wangguanzhong 已提交
222
    - [RCNN参数说明](docs/tutorials/config_annotation/faster_rcnn_r50_fpn_1x_coco_annotation.md)
223 224 225
    - [PP-YOLO参数说明](docs/tutorials/config_annotation/ppyolo_r50vd_dcn_1x_coco_annotation.md)
- 模型压缩(基于[PaddleSlim](https://github.com/PaddlePaddle/PaddleSlim))
    - [剪裁/量化/蒸馏教程](configs/slim)
226

W
wangguanzhong 已提交
227 228
- [推理部署](deploy/README.md)
    - [模型导出教程](deploy/EXPORT_MODEL.md)
W
wangguanzhong 已提交
229
    - [Paddle Inference部署](deploy/README.md)
230 231
         - [Python端推理部署](deploy/python)
         - [C++端推理部署](deploy/cpp)
232 233
    - [Paddle-Lite部署](deploy/lite)
    - [Paddle Serving部署](deploy/serving)
W
wangguanzhong 已提交
234
    - [ONNX模型导出](deploy/EXPORT_ONNX_MODEL.md)
W
wangguanzhong 已提交
235
    - [推理benchmark](deploy/BENCHMARK_INFER.md)
236
- 进阶开发
W
wangguanzhong 已提交
237 238 239 240 241 242 243
    - [数据处理模块](docs/advanced_tutorials/READER.md)
    - [新增检测模型](docs/advanced_tutorials/MODEL_TECHNICAL.md)

## 模型库

- 通用目标检测:
    - [模型库](docs/MODEL_ZOO_cn.md)
244
    - [PP-YOLO模型](configs/ppyolo/README_cn.md)
245 246
    - [增强版Anchor Free模型TTFNet](configs/ttfnet/README.md)
    - [移动端模型](static/configs/mobile/README.md)
W
wangguanzhong 已提交
247 248
    - [676类目标检测](static/docs/featured_model/LARGE_SCALE_DET_MODEL.md)
    - [两阶段实用模型PSS-Det](configs/rcnn_enhance/README.md)
249
    - [半监督知识蒸馏预训练检测模型](docs/feature_models/SSLD_PRETRAINED_MODEL.md)
W
wangguanzhong 已提交
250 251 252 253
- 通用实例分割
    - [SOLOv2](configs/solov2/README.md)
- 旋转框检测
    - [S2ANet](configs/dota/README.md)
W
wangguanzhong 已提交
254 255
- [关键点检测](configs/keypoint)
    - HigherHRNet
256
    - HRNet
257
    - LiteHRNet
W
wangguanzhong 已提交
258 259 260 261
- [多目标跟踪](configs/mot/README_cn.md)
    - [DeepSORT](configs/mot/deepsort/README_cn.md)
    - [JDE](configs/mot/jde/README_cn.md)
    - [FairMOT](configs/mot/fairmot/README_cn.md)
W
wangguanzhong 已提交
262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283
- 垂类领域
    - [行人检测](configs/pedestrian/README.md)
    - [车辆检测](configs/vehicle/README.md)
    - [人脸检测](configs/face_detection/README.md)
- 比赛冠军方案
    - [Objects365 2019 Challenge夺冠模型](static/docs/featured_model/champion_model/CACascadeRCNN.md)
    - [Open Images 2019-Object Detction比赛最佳单模型](static/docs/featured_model/champion_model/OIDV5_BASELINE_MODEL.md)

## 应用案例

- [人像圣诞特效自动生成工具](static/application/christmas)

## 第三方教程推荐

- [PaddleDetection在Windows下的部署(一)](https://zhuanlan.zhihu.com/p/268657833)
- [PaddleDetection在Windows下的部署(二)](https://zhuanlan.zhihu.com/p/280206376)
- [Jetson Nano上部署PaddleDetection经验分享](https://zhuanlan.zhihu.com/p/319371293)
- [安全帽检测YOLOv3模型在树莓派上的部署](https://github.com/PaddleCV-FAQ/PaddleDetection-FAQ/blob/main/Lite%E9%83%A8%E7%BD%B2/yolov3_for_raspi.md)
- [使用SSD-MobileNetv1完成一个项目--准备数据集到完成树莓派部署](https://github.com/PaddleCV-FAQ/PaddleDetection-FAQ/blob/main/Lite%E9%83%A8%E7%BD%B2/ssd_mobilenet_v1_for_raspi.md)

## 版本更新

K
Kaipeng Deng 已提交
284
版本更新内容请参考[版本更新文档](docs/CHANGELOG.md)
W
wangguanzhong 已提交
285 286 287 288 289 290 291 292 293 294


## 许可证书

本项目的发布受[Apache 2.0 license](LICENSE)许可认证。


## 贡献代码

我们非常欢迎你可以为PaddleDetection提供代码,也十分感谢你的反馈。
295
- 感谢[Mandroide](https://github.com/Mandroide)清理代码并且统一部分函数接口。
W
Wenyu 已提交
296 297
- 感谢[FL77N](https://github.com/FL77N/)贡献`Sparse-RCNN`模型。
- 感谢[Chen-Song](https://github.com/Chen-Song)贡献`Swin Faster-RCNN`模型。
W
wangguanzhong 已提交
298 299 300 301 302 303 304 305 306 307 308

## 引用

```
@misc{ppdet2019,
title={PaddleDetection, Object detection and instance segmentation toolkit based on PaddlePaddle.},
author={PaddlePaddle Authors},
howpublished = {\url{https://github.com/PaddlePaddle/PaddleDetection}},
year={2019}
}
```