CHANGELOG.md

简体中文 | [English](./CHANGELOG_en.md)

# 版本更新信息

## 最新版本信息

### 2.5(08.26/2022)

- 特色模型
  - PP-YOLOE+：
    - 发布PP-YOLOE+模型，COCO test2017数据集精度提升0.7%-2.4% mAP，模型训练收敛速度提升3.75倍，端到端预测速度提升1.73-2.3倍
    - 发布智慧农业，夜间安防检测，工业质检场景预训练模型，精度提升1.3%-8.1% mAP
    - 支持分布式训练、在线量化、serving部署等10大高性能训练部署能力，新增C++/Python Serving、TRT原生推理、ONNX Runtime等5+部署demo教程
  - PP-PicoDet：
    - 发布PicoDet-NPU模型，支持模型全量化部署
    - 新增PicoDet版面分析模型，基于FGD蒸馏算法精度提升0.5% mAP
  - PP-TinyPose
    - 发布PP-TinyPose增强版，在健身、舞蹈等场景的业务数据集端到端AP提升9.1% AP
    - 覆盖侧身、卧躺、跳跃、高抬腿等非常规动作
    - 新增滤波稳定模块，关键点稳定性显著增强

- 场景能力
  - PP-Human v2
    - 发布PP-Human v2，支持四大产业特色功能：多方案行为识别案例库、人体属性识别、人流检测与轨迹留存以及高精度跨镜跟踪
    - 底层算法能力升级，行人检测精度提升1.5% mAP；行人跟踪精度提升10.2% MOTA，轻量级模型速度提升34%；属性识别精度提升0.6% ma，轻量级模型速度提升62.5%
    - 提供全流程教程，覆盖数据采集标注，模型训练优化和预测部署，及pipeline中后处理代码修改
    - 新增在线视频流输入支持
    - 易用性提升，一行代码执行功能，执行流程判断、模型下载背后自动完成。
  - PP-Vehicle
    - 全新发布PP-Vehicle，支持四大交通场景核心功能：车牌识别、属性识别、车流量统计、违章检测
    - 车牌识别支持基于PP-OCR v3的轻量级车牌识别模型
    - 车辆属性识别支持基于PP-LCNet多标签分类模型
    - 兼容图片、视频、在线视频流等各类数据输入格式
    - 易用性提升，一行代码执行功能，执行流程判断、模型下载背后自动完成。

- 前沿算法
  - YOLO家族全系列模型
    - 发布YOLO家族全系列模型，覆盖前沿检测算法YOLOv5、YOLOv6及YOLOv7
    - 基于ConvNext骨干网络，YOLO各算法训练周期缩5-8倍，精度普遍提升1%-5% mAP；使用模型压缩策略实现精度无损的同时速度提升30%以上
  - 新增基于ViT骨干网络高精度检测模型，COCO数据集精度达到55.7% mAP
  - 新增OC-SORT多目标跟踪模型
  - 新增ConvNeXt骨干网络

- 产业实践范例教程
  - 基于PP-TinyPose增强版的智能健身动作识别
  - 基于PP-Human的打架识别
  - 基于PP-Human的营业厅来客分析
  - 基于PP-Vehicle的车辆结构化分析
  - 基于PP-YOLOE+的PCB电路板缺陷检测

- 框架能力
  - 功能新增
    - 新增自动压缩工具支持并提供demo，PP-YOLOE l版本精度损失0.3% mAP，V100速度提升13%
    - 新增PaddleServing python/C++和ONNXRuntime部署demo
    - 新增PP-YOLOE 端到端TensorRT部署demo
    - 新增FGC蒸馏算法，RetinaNet精度提升3.3%
    - 新增分布式训练文档
  - 功能完善/Bug修复
    - 修复Windows c++部署编译问题
    - 修复VOC格式数据预测时保存结果问题
    - 修复FairMOT c++部署检测框输出
    - 旋转框检测模型S2ANet支持batch size>1部署

### 2.4(03.24/2022)

- PP-YOLOE：
  - 发布PP-YOLOE特色模型，l版本COCO test2017数据集精度51.6%，V100预测速度78.1 FPS，精度速度服务器端SOTA
  - 发布s/m/l/x系列模型，打通TensorRT、ONNX部署能力
  - 支持混合精度训练，训练较PP-YOLOv2加速33%

- PP-PicoDet:
  - 发布PP-PicoDet优化模型，精度提升2%左右，CPU预测速度提升63%。
  - 新增参数量0.7M的PicoDet-XS模型
  - 后处理集成到网络中，优化端到端部署成本

- 行人分析Pipeline：
  - 发布PP-Human行人分析Pipeline，覆盖行人检测、属性识别、行人跟踪、跨镜跟踪、人流量统计、动作识别多种功能，打通TensorRT部署
  - 属性识别支持StrongBaseline模型
  - ReID支持Centroid模型
  - 动作识别支持ST-GCN摔倒检测

- 模型丰富度:
  - 发布YOLOX，支持nano/tiny/s/m/l/x版本，x版本COCO val2017数据集精度51.8%

- 框架功能优化：
  - EMA训练速度优化20%，优化EMA训练模型保存方式
  - 支持infer预测结果保存为COCO格式

- 部署优化：
  - RCNN全系列模型支持Paddle2ONNX导出ONNX模型
  - SSD模型支持导出时融合解码OP，优化边缘端部署速度
  - 支持NMS导出TensorRT，TensorRT部署端到端速度提升

### 2.3(11.03/2021)

- 特色模型:
  - 检测: 轻量级移动端检测模型PP-PicoDet，精度速度达到移动端SOTA
  - 关键点: 轻量级移动端关键点模型PP-TinyPose

- 模型丰富度:
  - 检测：
    - 新增Swin-Transformer目标检测模型
    - 新增TOOD(Task-aligned One-stage Object Detection)模型
    - 新增GFL(Generalized Focal Loss)目标检测模型
    - 发布Sniper小目标检测优化方法，支持Faster RCNN及PP-YOLO系列模型
    - 发布针对EdgeBoard优化的PP-YOLO-EB模型

  - 跟踪
    - 发布实时跟踪系统PP-Tracking
    - 发布FairMot高精度模型、小尺度模型和轻量级模型
    - 发布行人、人头和车辆实跟踪垂类模型库，覆盖航拍监控、自动驾驶、密集人群、极小目标等场景
    - DeepSORT模型适配PP-YOLO, PP-PicoDet等更多检测器

  - 关键点
    - 新增Lite HRNet模型

- 预测部署:
  - YOLOv3系列模型支持NPU预测部署
  - FairMot模型C++预测部署打通
  - 关键点系列模型C++预测部署打通, Paddle Lite预测部署打通

- 文档:
  - 新增各系列模型英文文档

### 2.2(08.10/2021)

- 模型丰富度：
    - 发布Transformer检测模型：DETR、Deformable DETR、Sparse RCNN
    - 关键点检测新增Dark模型，发布Dark HRNet模型
    - 发布MPII数据集HRNet关键点检测模型
    - 发布人头、车辆跟踪垂类模型

- 模型优化：
    - 旋转框检测模型S2ANet发布Align Conv优化模型，DOTA数据集mAP优化至74.0

- 预测部署
    - 主流模型支持batch size>1预测部署，包含YOLOv3，PP-YOLO，Faster RCNN，SSD，TTFNet，FCOS
    - 新增多目标跟踪模型(JDE, FairMot, DeepSort) Python端预测部署支持，并支持TensorRT预测
    - 新增多目标跟踪模型FairMot联合关键点检测模型部署Python端预测部署支持
    - 新增关键点检测模型联合PP-YOLO预测部署支持

- 文档：
    - Windows预测部署文档新增TensorRT版本说明
    - FAQ文档更新发布

- 问题修复：
    - 修复PP-YOLO系列模型训练收敛性问题
    - 修复batch size>1时无标签数据训练问题


### 2.1(05.20/2021)
- 模型丰富度提升：
    - 发布关键点模型HRNet，HigherHRNet
    - 发布多目标跟踪模型DeepSort, FairMot, JDE

- 框架基础能力：
    - 支持无标注框训练

- 预测部署：
    - Paddle Inference YOLOv3系列模型支持batch size>1预测
    - 旋转框检测S2ANet模型预测部署打通
    - 增加量化模型Benchmark
    - 增加动态图模型与静态图模型Paddle-Lite demo

- 检测模型压缩：
    - 发布PPYOLO系列模型压缩模型

- 文档：
    - 更新快速开始，预测部署等教程文档
    - 新增ONNX模型导出教程
    - 新增移动端部署文档


### 2.0(04.15/2021)

  **说明：** 自2.0版本开始，动态图作为PaddleDetection默认版本，原`dygraph`目录切换为根目录，原静态图实现移动到`static`目录下。

  - 动态图模型丰富度提升：
    - 发布PP-YOLOv2及PP-YOLO tiny模型，PP-YOLOv2 COCO test数据集精度达到49.5%，V100预测速度达到68.9 FPS
    - 发布旋转框检测模型S2ANet
    - 发布两阶段实用模型PSS-Det
    - 发布人脸检测模型Blazeface

  - 新增基础模块：
    - 新增SENet，GhostNet，Res2Net骨干网络
    - 新增VisualDL训练可视化支持
    - 新增单类别精度计算及PR曲线绘制功能
    - YOLO系列模型支持NHWC数据格式

  - 预测部署：
    - 发布主要模型的预测benchmark数据
    - 适配TensorRT6，支持TensorRT动态尺寸输入，支持TensorRT int8量化预测
    - PP-YOLO, YOLOv3, SSD, TTFNet, FCOS, Faster RCNN等7类模型在Linux、Windows、NV Jetson平台下python/cpp/TRT预测部署打通:

  - 检测模型压缩：
    - 蒸馏：新增动态图蒸馏支持，并发布YOLOv3-MobileNetV1蒸馏模型
    - 联合策略：新增动态图剪裁+蒸馏联合策略压缩方案，并发布YOLOv3-MobileNetV1的剪裁+蒸馏压缩模型
    - 问题修复：修复动态图量化模型导出问题

  - 文档：
    - 新增动态图英文文档：包含首页文档，入门使用，快速开始，模型算法、新增数据集等
    - 新增动态图中英文安装文档
    - 新增动态图RCNN系列和YOLO系列配置文件模板及配置项说明文档


## 历史版本信息

### 2.0-rc(02.23/2021)
  - 动态图模型丰富度提升：
    - 优化RCNN模型组网及训练方式，RCNN系列模型精度提升(依赖Paddle develop或2.0.1版本)
    - 新增支持SSDLite，FCOS，TTFNet，SOLOv2系列模型
    - 新增行人和车辆垂类目标检测模型

  - 新增动态图基础模块：
    - 新增MobileNetV3，HRNet骨干网络
    - 优化RoIAlign计算逻辑，RCNN系列模型精度提升(依赖Paddle develop或2.0.1版本)
    - 新增支持Synchronized Batch Norm
    - 新增支持Modulated Deformable Convolution

  - 预测部署：
    - 发布动态图python、C++、Serving部署解决方案及文档，支持Faster RCNN，Mask RCNN，YOLOv3，PP-YOLO，SSD，TTFNet，FCOS，SOLOv2等系列模型预测部署
    - 动态图预测部署支持TensorRT模式FP32，FP16推理加速

  - 检测模型压缩：
    - 裁剪：新增动态图裁剪支持，并发布YOLOv3-MobileNetV1裁剪模型
    - 量化：新增动态图量化支持，并发布YOLOv3-MobileNetV1和YOLOv3-MobileNetV3量化模型

  - 文档：
    - 新增动态图入门教程文档：包含安装说明，快速开始，准备数据，训练/评估/预测流程文档
    - 新增动态图进阶教程文档：包含模型压缩、推理部署文档
    - 新增动态图模型库文档

### v2.0-beta(12.20/2020)
  - 动态图支持:
    - 支持Faster-RCNN, Mask-RCNN, FPN, Cascade Faster/Mask RCNN, YOLOv3和SSD模型，试用版本。
  - 模型提升：
    - 更新PP-YOLO MobileNetv3 large和small模型，精度提升，并新增裁剪和蒸馏后的模型。
  - 新功能：
    - 支持VisualDL可视化数据预处理图片。

  - Bug修复:
    - 修复BlazeFace人脸关键点预测bug。


### v0.5.0(11/2020)
  - 模型丰富度提升：
    - 发布SOLOv2系列模型，其中SOLOv2-Light-R50-VD-DCN-FPN 模型在单卡V100上达到 38.6 FPS，加速24% ，COCO验证集精度达到38.8%, 提升2.4绝对百分点。
    - 新增Android移动端检测demo，包括SSD、YOLO系列模型，可直接扫码安装体验。

  - 移动端模型优化：
    - 新增PACT新量化策略，YOLOv3-Mobilenetv3在COCO数据集上比普通量化相比提升0.7%。

  - 易用性提升及功能组件：
    - 增强generate_proposal_labels算子功能，规避模型出nan风险。
    - 修复deploy下python与C++预测若干问题。
    - 统一COCO与VOC数据集下评估流程，支持输出单类AP和P-R曲线。
    - PP-YOLO支持矩形输入图像。

  - 文档：
    - 新增目标检测全流程教程，新增Jetson平台部署教程。


### v0.4.0(07/2020)
  - 模型丰富度提升：
    - 发布PPYOLO模型，COCO数据集精度达到45.2%，单卡V100预测速度达到72.9 FPS，精度和预测速度优于YOLOv4模型。
    - 新增TTFNet模型，base版本对齐竞品，COCO数据集精度达到32.9%。
    - 新增HTC模型，base版本对齐竞品，COCO数据集精度达到42.2%。
    - 新增BlazeFace人脸关键点检测模型，在Wider-Face数据集的Easy-Set精度达到85.2%。
    - 新增ACFPN模型， COCO数据集精度达到39.6%。
    - 发布服务器端通用目标检测模型（包含676类），相同策略在COCO数据集上，V100为19.5FPS时，COCO mAP可以达到49.4%。

  - 移动端模型优化：
    - 新增SSDLite系列优化模型，包括新增GhostNet的Backbone，新增FPN组件等，精度提升0.5%-1.5%。

  - 易用性提升及功能组件：
    - 新增GridMask, RandomErasing数据增强方法。
    - 新增Matrix NMS支持。
    - 新增EMA(Exponential Moving Average)训练支持。
    - 新增多机训练方法，两机相对于单机平均加速比80%，多机训练支持待进一步验证。

### v0.3.0(05/2020)
  - 模型丰富度提升：
    - 添加Efficientdet-D0模型，速度与精度优于竞品。
    - 新增YOLOv4预测模型，精度对齐竞品；新增YOLOv4在Pascal VOC数据集上微调训练，精度达到85.5%。
    - YOLOv3新增MobileNetV3骨干网络，COCO数据集精度达到31.6%。
    - 添加Anchor-free模型FCOS，精度优于竞品。
    - 添加Anchor-free模型CornernetSqueeze，精度优于竞品，优化模型的COCO数据集精度38.2%, +3.7%，速度较YOLOv3-Darknet53快5%。
    - 添加服务器端实用目标检测模型CascadeRCNN-ResNet50vd模型，速度与精度优于竞品EfficientDet。

  - 移动端推出3种模型：
    - SSDLite系列模型：SSDLite-Mobilenetv3 small/large模型，精度优于竞品。
    - YOLOv3移动端方案: YOLOv3-MobileNetv3模型压缩后加速3.5倍，速度和精度均领先于竞品的SSDLite模型。
    - RCNN移动端方案：CascadeRCNN-MobileNetv3经过系列优化, 推出输入图像分别为320x320和640x640的模型，速度与精度具有较高性价比。

  - 预测部署重构：
    - 新增Python预测部署流程，支持RCNN，YOLO，SSD，RetinaNet，人脸系列模型，支持视频预测。
    - 重构C++预测部署，提高易用性。

  - 易用性提升及功能组件：
    - 增加AutoAugment数据增强。
    - 升级检测库文档结构。
    - 支持迁移学习自动进行shape匹配。
    - 优化mask分支评估阶段内存占用。

### v0.2.0(02/2020)
  - 新增模型:
    - 新增基于CBResNet模型。
    - 新增LibraRCNN模型。
    - 进一步提升YOLOv3模型精度，基于COCO数据精度达到43.2%，相比上个版本提升1.4%。
  - 新增基础模块:
    - 主干网络: 新增CBResNet。
    - loss模块: YOLOv3的loss支持细粒度op组合。
    - 正则模块: 新增DropBlock模块。
  - 功能优化和改进:
    - 加速YOLOv3数据预处理，整体训练提速40%。
    - 优化数据预处理逻辑，提升易用性。
    - 增加人脸检测预测benchmark数据。
    - 增加C++预测引擎Python API预测示例。
  - 检测模型压缩 :
    - 裁剪: 发布MobileNet-YOLOv3裁剪方案和模型，基于VOC数据FLOPs - 69.6%, mAP + 1.4%，基于COCO数据FLOPS-28.8%, mAP + 0.9%; 发布ResNet50vd-dcn-YOLOv3裁剪方案和模型，基于COCO数据集FLOPS - 18.4%, mAP + 0.8%。
    - 蒸馏: 发布MobileNet-YOLOv3蒸馏方案和模型，基于VOC数据mAP + 2.8%，基于COCO数据mAP + 2.1%。
    - 量化: 发布YOLOv3-MobileNet和BlazeFace的量化模型。
    - 裁剪+蒸馏: 发布MobileNet-YOLOv3裁剪+蒸馏方案和模型，基于COCO数据FLOPS - 69.6%，基于TensorRT预测加速64.5%，mAP - 0.3 %; 发布ResNet50vd-dcn-YOLOv3裁剪+蒸馏方案和模型，基于COCO数据FLOPS - 43.7%，基于TensorRT预测加速24.0%，mAP + 0.6 %。
    - 搜索: 开源BlazeFace-Nas的完成搜索方案。
  - 预测部署:
    - 集成 TensorRT，支持FP16、FP32、INT8量化推理加速。
  - 文档:
    - 增加详细的数据预处理模块介绍文档以及实现自定义数据Reader文档。
    - 增加如何新增算法模型的文档。
    - 文档部署到网站: https://paddledetection.readthedocs.io

### 12/2019
- 增加Res2Net模型。
- 增加HRNet模型。
- 增加GIOU loss和DIOU loss。


### 21/11/2019
- 增加CascadeClsAware RCNN模型。
- 增加CBNet，ResNet200和Non-local模型。
- 增加SoftNMS。
- 增加Open Image V5数据集和Objects365数据集模型。

### 10/2019
- 增加增强版YOLOv3模型，精度高达41.4%。
- 增加人脸检测模型BlazeFace、Faceboxes。
- 丰富基于COCO的模型，精度高达51.9%。
- 增加Objects365 2019 Challenge上夺冠的最佳单模型之一CACascade-RCNN。
- 增加行人检测和车辆检测预训练模型。
- 支持FP16训练。
- 增加跨平台的C++推理部署方案。
- 增加模型压缩示例。


### 2/9/2019
- 增加GroupNorm模型。
- 增加CascadeRCNN+Mask模型。

### 5/8/2019
- 增加Modulated Deformable Convolution系列模型。

### 29/7/2019

- 增加检测库中文文档
- 修复R-CNN系列模型训练同时进行评估的问题
- 新增ResNext101-vd + Mask R-CNN + FPN模型
- 新增基于VOC数据集的YOLOv3模型

### 3/7/2019

- 首次发布PaddleDetection检测库和检测模型库
- 模型包括：Faster R-CNN, Mask R-CNN, Faster R-CNN+FPN, Mask
  R-CNN+FPN, Cascade-Faster-RCNN+FPN, RetinaNet, YOLOv3, 和SSD.