Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
bd226743
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
接近 2 年 前同步成功
通知
116
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
bd226743
编写于
11月 04, 2020
作者:
L
littletomatodonkey
提交者:
GitHub
11月 04, 2020
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add faq_2020_s1 (#362)
add faq_2020_s1
上级
4799907e
变更
5
隐藏空白更改
内联
并排
Showing
5 changed file
with
81 addition
and
3 deletion
+81
-3
README_cn.md
README_cn.md
+3
-2
docs/images/faq/ResNet_vabcd_structure.png
docs/images/faq/ResNet_vabcd_structure.png
+0
-0
docs/zh_CN/faq.md
docs/zh_CN/faq.md
+1
-1
docs/zh_CN/faq_series.md
docs/zh_CN/faq_series.md
+10
-0
docs/zh_CN/faq_series/faq_2020_s1.md
docs/zh_CN/faq_series/faq_2020_s1.md
+67
-0
未找到文件。
README_cn.md
浏览文件 @
bd226743
...
@@ -79,8 +79,9 @@
...
@@ -79,8 +79,9 @@
-
[
10万类图像分类预训练模型
](
./docs/zh_CN/application/transfer_learning.md
)
-
[
10万类图像分类预训练模型
](
./docs/zh_CN/application/transfer_learning.md
)
-
[
通用目标检测
](
./docs/zh_CN/application/object_detection.md
)
-
[
通用目标检测
](
./docs/zh_CN/application/object_detection.md
)
-
FAQ
-
FAQ
-
[
图像分类通用问题
](
./docs/zh_CN/faq.md
)
-
[
图像分类2020第一季精选问题(近期更新2020.11.04)
](
./docs/zh_CN/faq_series/faq_2020_s1.md
)
-
[
PaddleClas实战FAQ
](
./docs/zh_CN/faq.md
)
-
[
图像分类通用30个问题
](
./docs/zh_CN/faq.md
)
-
[
PaddleClas实战15个问题
](
./docs/zh_CN/faq.md
)
-
[
赛事支持
](
./docs/zh_CN/competition_support.md
)
-
[
赛事支持
](
./docs/zh_CN/competition_support.md
)
-
[
许可证书
](
#许可证书
)
-
[
许可证书
](
#许可证书
)
-
[
贡献代码
](
#贡献代码
)
-
[
贡献代码
](
#贡献代码
)
...
...
docs/images/faq/ResNet_vabcd_structure.png
0 → 100644
浏览文件 @
bd226743
89.3 KB
docs/zh_CN/faq.md
浏览文件 @
bd226743
...
@@ -7,7 +7,7 @@
...
@@ -7,7 +7,7 @@
*
图像分类领域大佬众多,模型和论文更新速度也很快,本文档回答主要依赖有限的项目实践,难免挂一漏万,如有遗漏和不足,也希望有识之士帮忙补充和修正,万分感谢。
*
图像分类领域大佬众多,模型和论文更新速度也很快,本文档回答主要依赖有限的项目实践,难免挂一漏万,如有遗漏和不足,也希望有识之士帮忙补充和修正,万分感谢。
## PaddleClas常见问题汇总
(持续更新)
## PaddleClas常见问题汇总
*
[
图像分类30个问题
](
#图像分类30个问题
)
*
[
图像分类30个问题
](
#图像分类30个问题
)
*
[
基础知识
](
#基础知识
)
*
[
基础知识
](
#基础知识
)
...
...
docs/zh_CN/faq_series.md
0 → 100644
浏览文件 @
bd226743
# 图像分类FAQ(持续更新)
## 前言
*
本文档收集了大家在使用PaddleClas或者学习图像分类时遇到的一些问题,旨在为图像分类任务的开发者提供一些参考,如果问题欢迎帮忙补充和修正,不胜感激。
## 目录
*
[
【精选】图像分类30个问题及PaddleClas常见使用问题
](
./faq.md
)
*
[
2020 FAQ第一季
](
./faq_series/faq_2020_s1.md
)(
最近更新2020.11.03
)
docs/zh_CN/faq_series/faq_2020_s1.md
0 → 100644
浏览文件 @
bd226743
# 图像分类常见问题汇总 - 2020 第1季
## 目录
*
[
第1期
](
#第1期
)(
2020.11.03
)
<a
name=
"第一期"
></a>
## 第1期
### Q1.1: PaddleClas可以用来做什么?
**A**
:PaddleClas是飞桨为工业界和学术界所准备的一个图像分类任务的工具集,助力使用者训练出更好的视觉模型和应用落地。PaddleClas提供了基于图像分类的模型训练、评估、预测、部署全流程的服务,方便大家更加高效地学习图像分类。具体地,PaddleClas中包含如下一些特性 。
*
PaddleClas提供了24个系列的分类网络结构(ResNet, ResNet_vd, MobileNetV3, Res2Net, HRNet等)和训练配置,122个预训练模型和性能评估与预测,供大家选择并使用。
*
PaddleClas提供了TensorRT预测、python inference、c++ inference、Paddle-Lite预测部署等多种预测部署推理方案,在方便在多种环境中进行部署推理。
*
PaddleClas提供了一种简单的SSLD知识蒸馏方案,基于该方案蒸馏模型的识别准确率普遍提升3%以上。
*
PaddleClas支持AutoAugment、Cutout、Cutmix等8种数据增广算法详细介绍、代码复现和在统一实验环境下的效果评估。
*
PaddleClas支持在Windows/Linux/MacOS环境中基于CPU/GPU进行使用。
### Q1.2: ResNet系列模型是什么?有哪些模型?为什么在服务器端如此推荐ResNet系列模型?
**A**
: ResNet中创新性地引入了残差结构,通过堆叠多个残差结构从而构建了ResNet网络。实验表明使用残差块可以有效地提升收敛速度和精度,PaddleClas中,ResNet从小到达,依次有包含18、34、50、101、152、200层的ResNet结构,ResNet系列模型于2015年被提出,在不同的应用场景中,如分类、检测、分割等,都已经验证过其有效性,业界也早已对其进行了大量优化,该系列模型在速度和精度方面都有着非常明显的优势,对基于TensorRT以及FP16的预测支持得也很好,因而推荐大家使用ResNet系列模型;由于其模型所占存储相对较大,因此常用于服务器端。更多关于ResNet模型的介绍可以参考论文
[
Deep Residual Learning for Image Recognition
](
https://arxiv.org/abs/1512.03385
)
。
### Q1.3: ResNet_vd和ResNet、ResNet_vc结构有什么区别呢?
**A**
:
ResNet_va至vd的结构如下图所示,ResNet最早提出时为va结构,在降采样残差模块这个部分,在左边的特征变换通路中(Path A),第一个1x1卷积部分就行了降采样,从而导致信息丢失(卷积的kernel size为1,stride为2,输入特征图中 有部分特征没有参与卷积的计算);在vb结构中,把降采样的步骤从最开始的第一个1x1卷积调整到中间的3x3卷积中,从而避免了信息丢失的问题,PaddleClas中的ResNet模型默认就是ResNet_vb;vc结构则是将最开始这个7x7的卷积变成3个3x3的卷积,在感受野不变的情况下,计算量和存储大小几乎不变,而且实验证明精度相对于vb结构有所提升;vd结构是修改了降采样残差模块右边的特征通路(Path B)。把降采样的过程由平均池化这个操作去替代了,这一系列的改进(va->vd),几乎没有带来新增的预测耗时,结合适当的训练策略,比如说标签平滑以及mixup数据增广,精度可以提升高达2.7%。
<div
align=
"center"
>
<img
src=
"../../images/faq/ResNet_vabcd_structure.png"
width=
"800"
>
</div>
### Q1.4 如果确定使用ResNet系列模型,怎么根据实际的场景需求选用不同的模型呢?
**A**
:
ResNet系列模型中,相比于其他模型,ResNet_vd模型在预测速度几乎不变的情况下,精度有非常明显的提升,因此推荐大家使用ResNet_vd系列模型。
下面给出了batch size=4的情况下,在T4 GPU上,不同模型的的预测耗时、flops、params与精度的变化曲线,可以根据自己自己的实际部署场景中的需求,去选择合适的模型,如果希望模型存储大小尽可能小或者预测速度尽可能快,则可以使用ResNet18_vd模型,如果希望获得尽可能高的精度,则建议使用ResNet152_vd或者ResNet200_vd模型。更多关于ResNet系列模型的介绍可以参考文档:
[
ResNet及其vd系列模型文档
](
../models/ResNet_and_vd.md
)
。
*
精度-预测速度变化曲线
<div
align=
"center"
>
<img
src=
"../../images/models/T4_benchmark/t4.fp32.bs4.ResNet.png"
width=
"800"
>
</div>
*
精度-params变化曲线
<div
align=
"center"
>
<img
src=
"../../images/models/T4_benchmark/t4.fp32.bs4.ResNet.params.png"
width=
"800"
>
</div>
*
精度-flops变化曲线
<div
align=
"center"
>
<img
src=
"../../images/models/T4_benchmark/t4.fp32.bs4.ResNet.flops.png"
width=
"800"
>
</div>
### Q1.5 在网络中的block里conv-bn-relu是固定的形式吗?
**A**
: 在batch-norm出现之前,主流的卷积神经网络的固定形式是conv-relu。在现阶段的卷积神经网络中,conv-bn-relu是大部分网络中block的固定形式,这样的设计是相对鲁棒的结构,此外,DenseNet中的block选用的是bn-relu-conv的形式,ResNet-V2中也使用的是这种组合方式。在MobileNetV2中,为了不丢失信息,部分block中间的层没有使用relu激活函数,选用的是conv-bn的形式。
### Q1.6 ResNet34与ResNet50的区别?
**A**
: ResNet系列中有两种不同的block,分别是basic-block和bottleneck-block,堆叠较多这样的block组成了ResNet网络。basic-block是带有shortcut的两个3x3的卷积核的堆叠,bottleneck-block是带有shortcut的1x1卷积核、3x3卷积核、1x1卷积核的堆叠,所以basic-block中有两层,bottleneck-block有三层。ResNet34和ResNet50中堆叠的block数相同,但是堆叠的种类分别是basic-block和bottleneck-block。
### Q1.7 大卷积核一定可以带来正向收益吗?
**A**
: 不一定,将网络中的所有卷积核都增大未必会带来性能的提升,甚至会有有损性能,在论文
[
MixConv: Mixed Depthwise Convolutional Kernels
](
https://arxiv.org/abs/1907.09595
)
中指出,在一定范围内提升卷积核大小对精度的提升有正向作用,但是超出后会有损精度。所以考虑到模型的大小、计算量等问题,一般不选用大的卷积核去设计网络。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录