提交 35bdf3a0 编写于 作者: O overlord

Merge branch 'develop' of https://github.com/PaddlePaddle/models into ncf_04291644

......@@ -12,30 +12,23 @@ PaddleCV全景图:
图像分类
--------
> 注意:图像分类内容已迁移至新的github地址:[https://github.com/PaddlePaddle/PaddleClas](https://github.com/PaddlePaddle/PaddleClas),欢迎大家去新的代码仓库中,查看与阅读更多关于图像分类的详细介绍以及新功能。
图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉中重要的基础问题,是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层视觉任务的基础,在许多领域都有着广泛的应用。如:安防领域的人脸识别和智能视频分析等,交通领域的交通场景识别,互联网领域基于内容的图像检索和相册自动归类,医学领域的图像识别等。
在深度学习时代,图像分类的准确率大幅度提升,在图像分类任务中,我们向大家介绍了如何在经典的数据集ImageNet上,训练常用的模型,包括AlexNet、VGG、ResNet、ResNeXt、Inception、MobileNet、SENet、DarkNet、SqueezeNet、ShuffleNet、Res2Net、DenseNet、DPN、EfficientNet、HRNet、AutoDL、ResNet-ACNet等系列模型,也开源了共105个[预训练模型](./image_classification/README.md#已发布模型及其性能)方便用户下载使用。
- [AlexNet](./image_classification/models)
- [SqueezeNet](./image_classification/models)
- [VGG Series](./image_classification/models)
- [GoogleNet](./image_classification/models)
- [ResNet Series](./image_classification/models)
- [ResNeXt Series](./image_classification/models)
- [ShuffleNet Series](./image_classification/models)
- [DenseNet Series](./image_classification/models)
- [Inception Series](./image_classification/models)
- [MobileNet Series](./image_classification/models)
- [SENet Series](./image_classification/models)
- [DarkNet](./image_classification/models)
- [ResNeXt101_wsl Series](./image_classification/models)
- [Res2Net Series](./image_classification/models)
- [DenseNet Series](./image_classification/models)
- [DPN Series](./image_classification/models)
- [EfficientNet Series](./image_classification/models)
- [HRNet Series](./image_classification/models)
- [AutoDL Series](./image_classification/models)
- [ResNet-ACNet Series](./image_classification/models)
在深度学习时代,图像分类的准确率大幅度提升,在图像分类任务中,我们向大家介绍了如何在经典的数据集ImageNet上,训练常用的模型,包括AlexNet、VGG、ResNet、ResNeXt、Inception、MobileNet、SENet、DarkNet、SqueezeNet、ShuffleNet、Res2Net、DenseNet、DPN、EfficientNet、HRNet、AutoDL、ResNet-ACNet等系列模型,也开源了共117个[预训练模型](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html)方便用户下载使用。
- [ResNet及其Vd系列](https://paddleclas.readthedocs.io/zh_CN/latest/models/ResNet_and_vd.html)
- [SEResNeXt与Res2Net系列](https://paddleclas.readthedocs.io/zh_CN/latest/models/SEResNext_and_Res2Net.html)
- [Inception系列](https://paddleclas.readthedocs.io/zh_CN/latest/models/Inception.html)
- [HRNet系列](https://paddleclas.readthedocs.io/zh_CN/latest/models/HRNet.html)
- [DPN与DenseNet系列](https://paddleclas.readthedocs.io/zh_CN/latest/models/DPN_DenseNet.html)
- [EfficientNet与ResNeXt101_wsl系列](https://paddleclas.readthedocs.io/zh_CN/latest/models/EfficientNet_and_ResNeXt101_wsl.html)
- [移动端模型](https://paddleclas.readthedocs.io/zh_CN/latest/models/Mobile.html)
- [其他模型](https://paddleclas.readthedocs.io/zh_CN/latest/models/Others.html)
更多分类模型训练技巧和图像增广、知识蒸馏等高阶使用内容可以参考PaddleClas的github地址([https://github.com/PaddlePaddle/PaddleClas](https://github.com/PaddlePaddle/PaddleClas))与文档([https://paddleclas.readthedocs.io/zh_CN/latest/index.html](https://paddleclas.readthedocs.io/zh_CN/latest/index.html))。
目标检测
......@@ -74,10 +67,10 @@ PaddleCV全景图:
- [U-Net](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_unet.md)
- [ICNet](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_icnet.md)
- [PSPNet](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_pspnet.md)
- [DeepLabv3+](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_deeplabv3plus.md)
- [HRNet](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_hrnet.md)
- [Fast-SCNN](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_fast_scnn.md)
- [PSPNet](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_pspnet.md)
- [DeepLabv3+](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_deeplabv3plus.md)
- [HRNet](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_hrnet.md)
- [Fast-SCNN](https://github.com/PaddlePaddle/PaddleSeg/blob/release/v0.4.0/turtorial/finetune_fast_scnn.md)
图像生成
-----------
......
......@@ -2,6 +2,9 @@
# 图像分类以及模型库
> 注意:该图像分类库已迁移至新的github地址:[https://github.com/PaddlePaddle/PaddleClas](https://github.com/PaddlePaddle/PaddleClas),欢迎大家去新的代码仓库中,查看与阅读更多关于图像分类的详细介绍以及新功能。
## 内容
- [简介](#简介)
- [快速开始](#快速开始)
......
......@@ -2,6 +2,8 @@ English | [中文](README.md)
# Image Classification and Model Zoo
> Note: The image classification library is migrated to new github repository: [https://github.com/PaddlePaddle/PaddleClas](https://github.com/PaddlePaddle/PaddleClas). More details about model zoo, high-end applications and many other new features can be seen in the new repository.
## Table of Contents
- [Introduction](#introduction)
......
......@@ -27,30 +27,30 @@ PaddlePaddle 提供了丰富的计算单元,使得用户可以采用模块化
### 图像分类
[图像分类](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) 是根据图像的语义信息对不同类别图像进行区分,是计算机视觉中重要的基础问题,是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层视觉任务的基础,在许多领域都有着广泛的应用。如:安防领域的人脸识别和智能视频分析等,交通领域的交通场景识别,互联网领域基于内容的图像检索和相册自动归类,医学领域的图像识别等。
[图像分类](https://github.com/PaddlePaddle/PaddleClas) 是根据图像的语义信息对不同类别图像进行区分,是计算机视觉中重要的基础问题,是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层视觉任务的基础,在许多领域都有着广泛的应用。如:安防领域的人脸识别和智能视频分析等,交通领域的交通场景识别,互联网领域基于内容的图像检索和相册自动归类,医学领域的图像识别等。
| **模型名称** | **模型简介** | **数据集** | **评估指标 top-1/top-5 accuracy** |
| - | - | - | - |
| [AlexNet](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 首次在 CNN 中成功的应用了 ReLU, Dropout 和 LRN,并使用 GPU 进行运算加速 | ImageNet-2012验证集 | 56.72%/79.17% |
| [VGG19](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 在 AlexNet 的基础上使用 3*3 小卷积核,增加网络深度,具有很好的泛化能力 | ImageNet-2012验证集 | 72.56%/90.93% |
| [GoogLeNet](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 在不增加计算负载的前提下增加了网络的深度和宽度,性能更加优越 | ImageNet-2012验证集 | 70.70%/89.66% |
| [ResNet50](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | Residual Network,引入了新的残差结构,解决了随着网络加深,准确率下降的问题 | ImageNet-2012验证集 | 76.50%/93.00% |
| [ResNet200_vd](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 融合多种对 ResNet 改进策略,ResNet200_vd 的 top1 准确率达到 80.93% | ImageNet-2012验证集 | 80.93%/95.33% |
| [Inceptionv4](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 将 Inception 模块与 Residual Connection 进行结合,通过ResNet的结构极大地加速训练并获得性能的提升 | ImageNet-2012验证集 | 80.77%/95.26% |
| [MobileNetV1](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 将传统的卷积结构改造成两层卷积结构的网络,在基本不影响准确率的前提下大大减少计算时间,更适合移动端和嵌入式视觉应用 | ImageNet-2012验证集 | 70.99%/89.68% |
| [MobileNetV2](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | MobileNet结构的微调,直接在 thinner 的 bottleneck层上进行 skip learning 连接以及对 bottleneck layer 不进行 ReLu 非线性处理可取得更好的结果 | ImageNet-2012验证集 | 72.15%/90.65% |
| [SENet154_vd](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 在ResNeXt 基础、上加入了 SE(Sequeeze-and-Excitation) 模块,提高了识别准确率,在 ILSVRC 2017 的分类项目中取得了第一名 | ImageNet-2012验证集 | 81.40%/95.48% |
| [ShuffleNetV2](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | ECCV2018,轻量级 CNN 网络,在速度和准确度之间做了很好地平衡。在同等复杂度下,比 ShuffleNet 和 MobileNetv2 更准确,更适合移动端以及无人车领域 | ImageNet-2012验证集 | 70.03%/89.17% |
| [efficientNet](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 同时对模型的分辨率,通道数和深度。进行缩放,用极少的参数就可以达到SOTA的精度。 | ImageNet-2012验证集 | 77.38%/93.31% |
| [xception71](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 对inception-v3的改进,用深度可分离卷积代替普通卷积,降低参数量的同时提高了精度。 | ImageNet-2012验证集 | 81.11%/95.45% |
| [dpn107](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 融合了densenet和resnext的特点。 | ImageNet-2012验证集 | 80.89%/95.32% |
| [mobilenetV3_small_x1_0](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 在v2的基础上增加了se模块,并且使用hard-swish激活函数。在分类、检测、分割等视觉任务上都有不错表现。 | ImageNet-2012验证集 | 67.46%/87.12% |
| [DarkNet53](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 检测框架yolov3使用的backbone,在分类和检测任务上都有不错表现。 | ImageNet-2012验证集 | 78.04%/94.05% |
| [DenseNet161](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 提出了密集连接的网络结构,更加有利于信息流的传递。 | ImageNet-2012验证集 | 78.57%/94.14% |
| [ResNeXt152_vd_64x4d](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 提出了cardinatity的概念,用于作为模型复杂度的另外一个度量,并依据该概念有效地提升了模型精度。 | ImageNet-2012验证集 | 81.08%/95.34% |
| [SqueezeNet1_1](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification) | 提出了新的网络架构Fire Module,通过减少参数来进行模型压缩。 | ImageNet-2012验证集 | 60.08%/81.85% |
更多图像分类模型请参考 [Image Classification](https://github.com/PaddlePaddle/models/tree/release/1.7/PaddleCV/image_classification)
| [AlexNet](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 首次在 CNN 中成功的应用了 ReLU, Dropout 和 LRN,并使用 GPU 进行运算加速 | ImageNet-2012验证集 | 56.72%/79.17% |
| [VGG19](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 在 AlexNet 的基础上使用 3*3 小卷积核,增加网络深度,具有很好的泛化能力 | ImageNet-2012验证集 | 72.56%/90.93% |
| [GoogLeNet](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 在不增加计算负载的前提下增加了网络的深度和宽度,性能更加优越 | ImageNet-2012验证集 | 70.70%/89.66% |
| [ResNet50](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | Residual Network,引入了新的残差结构,解决了随着网络加深,准确率下降的问题 | ImageNet-2012验证集 | 76.50%/93.00% |
| [ResNet200_vd](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 融合多种对 ResNet 改进策略,ResNet200_vd 的 top1 准确率达到 80.93% | ImageNet-2012验证集 | 80.93%/95.33% |
| [Inceptionv4](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 将 Inception 模块与 Residual Connection 进行结合,通过ResNet的结构极大地加速训练并获得性能的提升 | ImageNet-2012验证集 | 80.77%/95.26% |
| [MobileNetV1](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 将传统的卷积结构改造成两层卷积结构的网络,在基本不影响准确率的前提下大大减少计算时间,更适合移动端和嵌入式视觉应用 | ImageNet-2012验证集 | 70.99%/89.68% |
| [MobileNetV2](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | MobileNet结构的微调,直接在 thinner 的 bottleneck层上进行 skip learning 连接以及对 bottleneck layer 不进行 ReLu 非线性处理可取得更好的结果 | ImageNet-2012验证集 | 72.15%/90.65% |
| [SENet154_vd](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 在ResNeXt 基础、上加入了 SE(Sequeeze-and-Excitation) 模块,提高了识别准确率,在 ILSVRC 2017 的分类项目中取得了第一名 | ImageNet-2012验证集 | 81.40%/95.48% |
| [ShuffleNetV2](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | ECCV2018,轻量级 CNN 网络,在速度和准确度之间做了很好地平衡。在同等复杂度下,比 ShuffleNet 和 MobileNetv2 更准确,更适合移动端以及无人车领域 | ImageNet-2012验证集 | 70.03%/89.17% |
| [efficientNet](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 同时对模型的分辨率,通道数和深度。进行缩放,用极少的参数就可以达到SOTA的精度。 | ImageNet-2012验证集 | 77.38%/93.31% |
| [xception71](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 对inception-v3的改进,用深度可分离卷积代替普通卷积,降低参数量的同时提高了精度。 | ImageNet-2012验证集 | 81.11%/95.45% |
| [dpn107](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 融合了densenet和resnext的特点。 | ImageNet-2012验证集 | 80.89%/95.32% |
| [mobilenetV3_small_x1_0](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 在v2的基础上增加了se模块,并且使用hard-swish激活函数。在分类、检测、分割等视觉任务上都有不错表现。 | ImageNet-2012验证集 | 67.46%/87.12% |
| [DarkNet53](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 检测框架yolov3使用的backbone,在分类和检测任务上都有不错表现。 | ImageNet-2012验证集 | 78.04%/94.05% |
| [DenseNet161](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 提出了密集连接的网络结构,更加有利于信息流的传递。 | ImageNet-2012验证集 | 78.57%/94.14% |
| [ResNeXt152_vd_64x4d](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 提出了cardinatity的概念,用于作为模型复杂度的另外一个度量,并依据该概念有效地提升了模型精度。 | ImageNet-2012验证集 | 81.08%/95.34% |
| [SqueezeNet1_1](https://paddleclas.readthedocs.io/zh_CN/latest/models/index.html) | 提出了新的网络架构Fire Module,通过减少参数来进行模型压缩。 | ImageNet-2012验证集 | 60.08%/81.85% |
更多图像分类模型请参考 [PaddleClas](https://github.com/PaddlePaddle/PaddleClas)
### 目标检测
......
......@@ -9,9 +9,9 @@ python -m paddle.distributed.launch --selected_gpus=0,1,2,3 train.py \
--test_data ./data/test.tsv \
--model_save_dir ./padding_models \
--validation_steps 1000 \
--save_steps 10000 \
--print_steps 200 \
--batch_size 400 \
--save_steps 1 \
--print_steps 1 \
--batch_size 32 \
--epoch 10 \
--traindata_shuffle_buffer 20000 \
--word_emb_dim 128 \
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册