Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
a1ad2c89
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
1 年多 前同步成功
通知
115
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
a1ad2c89
编写于
12月 13, 2021
作者:
S
sibo2rr
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add speed in V100 and mobile
上级
4e6a3c85
变更
16
展开全部
隐藏空白更改
内联
并排
Showing
16 changed file
with
558 addition
and
417 deletion
+558
-417
docs/zh_CN/algorithm_introduction/ImageNet_models.md
docs/zh_CN/algorithm_introduction/ImageNet_models.md
+218
-220
docs/zh_CN/models/DLA.md
docs/zh_CN/models/DLA.md
+18
-1
docs/zh_CN/models/DPN_DenseNet.md
docs/zh_CN/models/DPN_DenseNet.md
+13
-13
docs/zh_CN/models/EfficientNet_and_ResNeXt101_wsl.md
docs/zh_CN/models/EfficientNet_and_ResNeXt101_wsl.md
+16
-16
docs/zh_CN/models/HRNet.md
docs/zh_CN/models/HRNet.md
+11
-11
docs/zh_CN/models/HarDNet.md
docs/zh_CN/models/HarDNet.md
+13
-0
docs/zh_CN/models/Inception.md
docs/zh_CN/models/Inception.md
+9
-9
docs/zh_CN/models/MixNet.md
docs/zh_CN/models/MixNet.md
+11
-0
docs/zh_CN/models/Mobile.md
docs/zh_CN/models/Mobile.md
+124
-79
docs/zh_CN/models/Others.md
docs/zh_CN/models/Others.md
+10
-10
docs/zh_CN/models/PP-LCNet.md
docs/zh_CN/models/PP-LCNet.md
+28
-11
docs/zh_CN/models/ReXNet.md
docs/zh_CN/models/ReXNet.md
+13
-0
docs/zh_CN/models/RedNet.md
docs/zh_CN/models/RedNet.md
+14
-1
docs/zh_CN/models/ResNeSt_RegNet.md
docs/zh_CN/models/ResNeSt_RegNet.md
+13
-2
docs/zh_CN/models/ResNet_and_vd.md
docs/zh_CN/models/ResNet_and_vd.md
+18
-18
docs/zh_CN/models/SEResNext_and_Res2Net.md
docs/zh_CN/models/SEResNext_and_Res2Net.md
+29
-26
未找到文件。
docs/zh_CN/algorithm_introduction/ImageNet_models.md
浏览文件 @
a1ad2c89
此差异已折叠。
点击以展开。
docs/zh_CN/models/DLA.md
浏览文件 @
a1ad2c89
...
...
@@ -3,6 +3,7 @@
## 目录
*
[
1. 概述
](
#1
)
*
[
2. 精度、FLOPS 和参数量
](
#2
)
*
[
3. 基于 V100 GPU 的预测速度
](
#3
)
<a
name=
'1'
></a>
...
...
@@ -25,4 +26,20 @@ DLA(Deep Layer Aggregation)。 视觉识别需要丰富的表示形式,其范
| DLA102 | 33.3 | 7.2 | 78.93 | 94.52 |
| DLA102x | 26.4 | 5.9 | 78.10 | 94.00 |
| DLA102x2 | 41.4 | 9.3 | 78.85 | 94.45 |
| DLA169 | 53.5 | 11.6 | 78.09 | 94.09 |
\ No newline at end of file
| DLA169 | 53.5 | 11.6 | 78.09 | 94.09 |
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| 模型 | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| -------- | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| DLA102 | 224 | 256 | 4.95 | 8.08 | 12.40 |
| DLA102x2 | 224 | 256 | 19.58 | 23.97 | 31.37 |
| DLA102x | 224 | 256 | 11.12 | 15.60 | 20.37 |
| DLA169 | 224 | 256 | 7.70 | 12.25 | 18.90 |
| DLA34 | 224 | 256 | 1.83 | 3.37 | 5.98 |
| DLA46_c | 224 | 256 | 1.06 | 2.08 | 3.23 |
| DLA60 | 224 | 256 | 2.78 | 5.36 | 8.29 |
| DLA60x_c | 224 | 256 | 1.79 | 3.68 | 5.19 |
| DLA60x | 224 | 256 | 5.98 | 9.24 | 12.52 |
\ No newline at end of file
docs/zh_CN/models/DPN_DenseNet.md
浏览文件 @
a1ad2c89
...
...
@@ -12,7 +12,7 @@
## 1. 概述
DenseNet 是 2017 年 CVPR best paper 提出的一种新的网络结构,该网络设计了一种新的跨层连接的 block,即 dense-block。相比 ResNet 中的 bottleneck,dense-block 设计了一个更激进的密集连接机制,即互相连接所有的层,每个层都会接受其前面所有层作为其额外的输入。DenseNet 将所有的 dense-block 堆叠,组合成了一个密集连接型网络。密集的连接方式使得 DenseNe 更容易进行梯度的反向传播,使得网络更容易训练。
DPN 的全称是 Dual Path Networks,即双通道网络。该网络是由 DenseNet 和 ResNeXt 结合的一个网络,其证明了 DenseNet 能从靠前的层级中提取到新的特征,而 ResNeXt 本质上是对之前层级中已提取特征的复用。作者进一步分析发现,ResNeXt 对特征有高复用率,但冗余度低,DenseNet 能创造新特征,但冗余度高。结合二者结构的优势,作者设计了 DPN 网络。最终 DPN 网络在同样 FLOPS 和参数量下,取得了比 ResNeXt 与 DenseNet 更好的结果。
该系列模型的 FLOPS、参数量以及 T4 GPU 上的预测耗时如下图所示。
![](
../../images/models/T4_benchmark/t4.fp32.bs4.DPN.flops.png
)
...
...
@@ -48,18 +48,18 @@ DPN 的全称是 Dual Path Networks,即双通道网络。该网络是由 Dense
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br
>
Batch Size=1
<br
>
(ms) |
|-------------|-----------|-------------------|--------------------------|
| DenseNet121 | 224 | 256 |
4.371
|
| DenseNet161 | 224 | 256 |
8.863
|
| DenseNet169 | 224 | 256 |
6.391
|
| DenseNet201 | 224 | 256 |
8.173
|
| DenseNet264 | 224 | 256 |
11.942
|
| DPN68 | 224 | 256 |
11.805
|
| DPN92 | 224 | 256 | 1
7.840
|
| DPN98 | 224 | 256 |
21.057
|
| DPN107 | 224 | 256 |
28.685
|
| DPN131 | 224 | 256 |
28.083
|
| Models | Crop Size | Resize Short Size | FP32
<br
/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/
>
(ms) |
|-------------|-----------|-------------------|-------------------
|-------------------|------------
-------|
| DenseNet121 | 224 | 256 |
3.40 | 6.94 | 9.17
|
| DenseNet161 | 224 | 256 |
7.06 | 14.37 | 19.55
|
| DenseNet169 | 224 | 256 |
5.00 | 10.29 | 12.84
|
| DenseNet201 | 224 | 256 |
6.38 | 13.72 | 17.17
|
| DenseNet264 | 224 | 256 |
9.34 | 20.95 | 25.41
|
| DPN68 | 224 | 256 |
8.18 | 11.40 | 14.82
|
| DPN92 | 224 | 256 | 1
2.48 | 20.04 | 25.10
|
| DPN98 | 224 | 256 |
14.70 | 25.55 | 35.12
|
| DPN107 | 224 | 256 |
19.46 | 35.62 | 50.22
|
| DPN131 | 224 | 256 |
19.64 | 34.60 | 47.42
|
<a
name=
'4'
></a>
...
...
docs/zh_CN/models/EfficientNet_and_ResNeXt101_wsl.md
浏览文件 @
a1ad2c89
...
...
@@ -50,22 +50,22 @@ ResNeXt 是 facebook 于 2016 年提出的一种对 ResNet 的改进版网络。
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br
>
Batch Size=1
<br
>
(ms) |
|-------------------------------|-----------|-------------------|--------------------------|
| ResNeXt101_
<br>
32x8d_wsl | 224 | 256 | 1
9.127
|
| ResNeXt101_
<br>
32x16d_wsl | 224 | 256 | 2
3.629
|
| ResNeXt101_
<br>
32x32d_wsl | 224 | 256 |
40.214
|
| ResNeXt101_
<br>
32x48d_wsl | 224 | 256 | 5
9.714
|
| Fix_ResNeXt101_
<br>
32x48d_wsl | 320 | 320 |
82.431
|
| EfficientNetB0 | 224 | 256 |
2.449
|
| EfficientNetB1 | 240 | 272 |
3.547
|
| EfficientNetB2 | 260 | 292 | 3.
908
|
| EfficientNetB3 | 300 | 332 |
5.145
|
| EfficientNetB4 | 380 | 412 |
7.609
|
| EfficientNetB5 | 456 | 488 | 1
2.078
|
| EfficientNetB6 | 528 | 560 | 1
8.381
|
| EfficientNetB7 | 600 | 632 | 2
7.817
|
| EfficientNetB0_
<br>
small | 224 | 256 | 1.
692
|
| Models | Crop Size | Resize Short Size | FP32
<br
/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/
>
(ms) |
|-------------------------------|-----------|-------------------|--------------------------
-----|-------------------------------|-------------------------------
|
| ResNeXt101_
<br>
32x8d_wsl | 224 | 256 | 1
3.55 | 23.39 | 36.18
|
| ResNeXt101_
<br>
32x16d_wsl | 224 | 256 | 2
1.96 | 38.35 | 63.29
|
| ResNeXt101_
<br>
32x32d_wsl | 224 | 256 |
37.28 | 76.50 | 121.56
|
| ResNeXt101_
<br>
32x48d_wsl | 224 | 256 | 5
5.07 | 124.39 | 205.01
|
| Fix_ResNeXt101_
<br>
32x48d_wsl | 320 | 320 |
55.01 | 122.63 | 204.66
|
| EfficientNetB0 | 224 | 256 |
1.96 | 3.71 | 5.56
|
| EfficientNetB1 | 240 | 272 |
2.88 | 5.40 | 7.63
|
| EfficientNetB2 | 260 | 292 | 3.
26 | 6.20 | 9.17
|
| EfficientNetB3 | 300 | 332 |
4.52 | 8.85 | 13.54
|
| EfficientNetB4 | 380 | 412 |
6.78 | 15.47 | 24.95
|
| EfficientNetB5 | 456 | 488 | 1
0.97 | 27.24 | 45.93
|
| EfficientNetB6 | 528 | 560 | 1
7.09 | 43.32 | 76.90
|
| EfficientNetB7 | 600 | 632 | 2
5.91 | 71.23 | 128.20
|
| EfficientNetB0_
<br>
small | 224 | 256 | 1.
24 | 2.59 | 3.92
|
<a
name=
'4'
></a>
...
...
docs/zh_CN/models/HRNet.md
浏览文件 @
a1ad2c89
...
...
@@ -43,17 +43,17 @@ HRNet 是 2019 年由微软亚洲研究院提出的一种全新的神经网络
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br
>
Batch Size=1
<br
>
(ms) |
|-------------|-----------|-------------------|--------------------------|
| HRNet_W18_C | 224 | 256 |
7.368
|
| HRNet_W18_C_ssld | 224 | 256 |
7.368
|
| HRNet_W30_C | 224 | 256 |
9.402
|
| HRNet_W32_C | 224 | 256 |
9.467
|
| HRNet_W40_C | 224 | 256 |
10.739
|
| HRNet_W44_C | 224 | 256 | 1
1.497
|
| HRNet_W48_C | 224 | 256 | 1
2.165
|
| HRNet_W48_C_ssld | 224 | 256 | 1
2.165
|
| HRNet_W64_C | 224 | 256 | 1
5.003
|
| Models | Crop Size | Resize Short Size | FP32
<br
/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/
>
(ms) |
|-------------|-----------|-------------------|-------------------
|-------------------|------------
-------|
| HRNet_W18_C | 224 | 256 |
6.66 | 8.94 | 11.95
|
| HRNet_W18_C_ssld | 224 | 256 |
6.66 | 8.92 | 11.93
|
| HRNet_W30_C | 224 | 256 |
8.61 | 11.40 | 15.23
|
| HRNet_W32_C | 224 | 256 |
8.54 | 11.58 | 15.57
|
| HRNet_W40_C | 224 | 256 |
9.83 | 15.02 | 20.92
|
| HRNet_W44_C | 224 | 256 | 1
0.62 | 16.18 | 25.92
|
| HRNet_W48_C | 224 | 256 | 1
1.07 | 17.06 | 27.28
|
| HRNet_W48_C_ssld | 224 | 256 | 1
1.09 | 17.04 | 27.28
|
| HRNet_W64_C | 224 | 256 | 1
3.82 | 21.15 | 35.51
|
<a
name=
'4'
></a>
...
...
docs/zh_CN/models/HarDNet.md
浏览文件 @
a1ad2c89
...
...
@@ -4,6 +4,7 @@
*
[
1. 概述
](
#1
)
*
[
2. 精度、FLOPS 和参数量
](
#2
)
*
[
3. 基于 V100 GPU 的预测速度
](
#3
)
<a
name=
'1'
></a>
## 1. 概述
...
...
@@ -20,3 +21,15 @@ HarDNet(Harmonic DenseNet)是 2019 年由国立清华大学提出的一种
| HarDNet85 | 36.7 | 9.1 | 77.44 | 93.55 |
| HarDNet39_ds | 3.5 | 0.4 | 71.33 | 89.98 |
| HarDNet68_ds | 4.2 | 0.8 | 73.62 | 91.52 |
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| ------------ | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| HarDNet68 | 224 | 256 | 3.58 | 8.53 | 11.58 |
| HarDNet85 | 224 | 256 | 6.24 | 14.85 | 20.57 |
| HarDNet39_ds | 224 | 256 | 1.40 | 2.30 | 3.33 |
| HarDNet68_ds | 224 | 256 | 2.26 | 3.34 | 5.06 |
docs/zh_CN/models/Inception.md
浏览文件 @
a1ad2c89
...
...
@@ -53,15 +53,15 @@ InceptionV4 是 2016 年由 Google 设计的新的神经网络,当时残差结
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br
>
Batch Size=1
<br
>
(ms) |
|------------------------|-----------|-------------------|--------------------------|
| GoogLeNet | 224 | 256 | 1.
807
|
| Xception41 | 299 | 320 | 3.
972
|
| Xception41_
<br>
deeplab | 299 | 320 |
4.408
|
| Xception65 | 299 | 320 |
6.174
|
| Xception65_
<br>
deeplab | 299 | 320 |
6.464
|
| Xception71 | 299 | 320 | 6.
782
|
| InceptionV4 | 299 | 320 |
11.141
|
| Models | Crop Size | Resize Short Size | FP32
<br
/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/
>
(ms) |
|------------------------|-----------|-------------------|------------------------
|------------------------|----------------------
--|
| GoogLeNet | 224 | 256 | 1.
41 | 3.25 | 5.00
|
| Xception41 | 299 | 320 | 3.
58 | 8.76 | 16.61
|
| Xception41_
<br>
deeplab | 299 | 320 |
3.81 | 9.16 | 17.20
|
| Xception65 | 299 | 320 |
5.45 | 12.78 | 24.53
|
| Xception65_
<br>
deeplab | 299 | 320 |
5.65 | 13.08 | 24.61
|
| Xception71 | 299 | 320 | 6.
19 | 15.34 | 29.21
|
| InceptionV4 | 299 | 320 |
8.93 | 15.17 | 21.56
|
<a
name=
'4'
></a>
...
...
docs/zh_CN/models/MixNet.md
浏览文件 @
a1ad2c89
...
...
@@ -4,6 +4,7 @@
*
[
1. 概述
](
#1
)
*
[
2. 精度、FLOPS 和参数量
](
#2
)
*
[
3. 基于 V100 GPU 的预测速度
](
#3
)
<a
name=
'1'
></a>
...
...
@@ -26,4 +27,14 @@ MixNet 是谷歌出的一篇关于轻量级网络的文章,主要工作就在
| MixNet_M | 77.67 | 93.64 | 77.0 | 357.119 | 5.065 |
| MixNet_L | 78.60 | 94.37 | 78.9 | 579.017 | 7.384 |
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| -------- | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| MixNet_S | 224 | 256 | 2.31 | 3.63 | 5.20 |
| MixNet_M | 224 | 256 | 2.84 | 4.60 | 6.62 |
| MixNet_L | 224 | 256 | 3.16 | 5.55 | 8.03 |
关于 Inference speed 等信息,敬请期待。
docs/zh_CN/models/Mobile.md
浏览文件 @
a1ad2c89
此差异已折叠。
点击以展开。
docs/zh_CN/models/Others.md
浏览文件 @
a1ad2c89
...
...
@@ -37,16 +37,16 @@ DarkNet53 是 YOLO 作者在论文设计的用于目标检测的 backbone,该
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br
>
Batch Size=1
<br
>
(ms) |
|---------------------------|-----------|-------------------|----------------------|
| AlexNet | 224 | 256 |
1.176
|
| SqueezeNet1_0 | 224 | 256 | 0.
860
|
| SqueezeNet1_1 | 224 | 256 | 0.
763
|
| VGG11 | 224 | 256 | 1.
867
|
| VGG13 | 224 | 256 | 2.
148
|
| VGG16 | 224 | 256 | 2.
616
|
| VGG19 | 224 | 256 |
3.076
|
| DarkNet53 | 256 | 256 |
3.139
|
| Models | Crop Size | Resize Short Size | FP32
<br
/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/
>
(ms) |
|---------------------------|-----------|-------------------|-------------------
|-------------------|----------------
---|
| AlexNet | 224 | 256 |
0.81 | 1.50 | 2.33
|
| SqueezeNet1_0 | 224 | 256 | 0.
68 | 1.64 | 2.62
|
| SqueezeNet1_1 | 224 | 256 | 0.
62 | 1.30 | 2.09
|
| VGG11 | 224 | 256 | 1.
72 | 4.15 | 7.24
|
| VGG13 | 224 | 256 | 2.
02 | 5.28 | 9.54
|
| VGG16 | 224 | 256 | 2.
48 | 6.79 | 12.33
|
| VGG19 | 224 | 256 |
2.93 | 8.28 | 15.21
|
| DarkNet53 | 256 | 256 |
2.79 | 6.42 | 10.89
|
<a
name=
'4'
></a>
...
...
docs/zh_CN/models/PP-LCNet.md
浏览文件 @
a1ad2c89
...
...
@@ -14,8 +14,9 @@
-
[
4.1 图像分类
](
#4.1
)
-
[
4.2 目标检测
](
#4.2
)
-
[
4.3 语义分割
](
#4.3
)
-
[
5. 总结
](
#5
)
-
[
6. 引用
](
#6
)
-
[
5. 基于 V100 GPU 的预测速度
](
#5
)
-
[
6. 总结
](
#6
)
-
[
7. 引用
](
#7
)
<a
name=
"1"
></a>
## 1. 摘要
...
...
@@ -54,7 +55,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
|
<b>
0000000000011
<b>
|
<b>
63.14
<b>
|
<b>
2.05
<b>
|
| 1111111111111 | 64.27 | 3.80 |
最终,PP-LCNet 中的 SE 模块的位置选用了表格中第三行的方案。
<a
name=
"3.3"
></a>
...
...
@@ -106,7 +107,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
| PP-LCNet-0.5x
\*
| 1.9 | 47 | 66.10 | 86.46 | 2.05 |
| PP-LCNet-1.0x
\*
| 3.0 | 161 | 74.39 | 92.09 | 2.46 |
| PP-LCNet-2.5x
\*
| 9.0 | 906 | 80.82 | 95.33 | 5.39 |
其中
\*
表示使用 SSLD 蒸馏后的模型。
与其他轻量级网络的性能对比:
...
...
@@ -145,18 +146,34 @@ MobileNetV3-large-0.75x | 25.8 | 11.1 |
| Backbone | mIoU(%) | Latency(ms) |
|-------|-----------|----------|
MobileNetV3-large-0.5x | 55.42 | 135 |
<b>
PP-LCNet-0.5x
<b>
|
<b>
58.36
<b>
|
<b>
82
<b>
|
MobileNetV3-large-0.75x | 64.53 | 151 |
<b>
PP-LCNet-1x
<b>
|
<b>
66.03
<b>
|
<b>
96
<b>
|
|
MobileNetV3-large-0.5x | 55.42 | 135 |
|
<b>
PP-LCNet-0.5x
<b>
|
<b>
58.36
<b>
|
<b>
82
<b>
|
|
MobileNetV3-large-0.75x | 64.53 | 151 |
|
<b>
PP-LCNet-1x
<b>
|
<b>
66.03
<b>
|
<b>
96
<b>
|
<a
name=
"5"
></a>
## 5. 总结
PP-LCNet 没有像学术界那样死扣极致的 FLOPs 与 Params,而是着眼于分析如何添加对 Intel CPU 友好的模块来提升模型的性能,这样可以更好的平衡准确率和推理时间,其中的实验结论也很适合其他网络结构设计的研究者,同时也为 NAS 搜索研究者提供了更小的搜索空间和一般结论。最终的 PP-LCNet 在产业界也可以更好的落地和应用。
## 5. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br>
Batch Size=1
<br>
(ms) | FP32
<br/>
Batch Size=1
\4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| ------------- | --------- | ----------------- | ---------------------------- | -------------------------------- | ------------------------------ |
| PPLCNet_x0_25 | 224 | 256 | 0.72 | 1.17 | 1.71 |
| PPLCNet_x0_35 | 224 | 256 | 0.69 | 1.21 | 1.82 |
| PPLCNet_x0_5 | 224 | 256 | 0.70 | 1.32 | 1.94 |
| PPLCNet_x0_75 | 224 | 256 | 0.71 | 1.49 | 2.19 |
| PPLCNet_x1_0 | 224 | 256 | 0.73 | 1.64 | 2.53 |
| PPLCNet_x1_5 | 224 | 256 | 0.82 | 2.06 | 3.12 |
| PPLCNet_x2_0 | 224 | 256 | 0.94 | 2.58 | 4.08 |
<a
name=
"6"
></a>
## 6. 引用
## 6. 总结
PP-LCNet 没有像学术界那样死扣极致的 FLOPs 与 Params,而是着眼于分析如何添加对 Intel CPU 友好的模块来提升模型的性能,这样可以更好的平衡准确率和推理时间,其中的实验结论也很适合其他网络结构设计的研究者,同时也为 NAS 搜索研究者提供了更小的搜索空间和一般结论。最终的 PP-LCNet 在产业界也可以更好的落地和应用。
<a
name=
"7"
></a>
## 7. 引用
如果你的论文用到了 PP-LCNet 的方法,请添加如下 cite:
```
...
...
docs/zh_CN/models/ReXNet.md
浏览文件 @
a1ad2c89
...
...
@@ -4,6 +4,7 @@
*
[
1. 概述
](
#1
)
*
[
2. 精度、FLOPS 和参数量
](
#2
)
*
[
3. 基于 V100 GPU 的预测速度
](
#3
)
<a
name=
'1'
></a>
...
...
@@ -24,4 +25,16 @@ ReXNet 是 NAVER 集团 ClovaAI 研发中心基于一种网络架构设计新范
| ReXNet_2_0 | 81.22 | 95.36 | 81.6 | 1.561 | 16.449 |
| ReXNet_3_0 | 82.09 | 96.12 | 82.8 | 3.445 | 34.833 |
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| ---------- | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| ReXNet_1_0 | 224 | 256 | 3.08 | 4.15 | 5.49 |
| ReXNet_1_3 | 224 | 256 | 3.54 | 4.87 | 6.54 |
| ReXNet_1_5 | 224 | 256 | 3.68 | 5.31 | 7.38 |
| ReXNet_2_0 | 224 | 256 | 4.30 | 6.54 | 9.19 |
| ReXNet_3_0 | 224 | 256 | 5.74 | 9.49 | 13.62 |
关于 Inference speed 等信息,敬请期待。
docs/zh_CN/models/RedNet.md
浏览文件 @
a1ad2c89
...
...
@@ -4,6 +4,7 @@
*
[
1. 概述
](
#1
)
*
[
2. 精度、FLOPS 和参数量
](
#2
)
*
[
3. 基于 V100 GPU 的预测速度
](
#3
)
<a
name=
'1'
></a>
## 1. 概述
...
...
@@ -19,4 +20,16 @@
| RedNet38 | 12.4 | 2.2 | 77.47 | 93.56 |
| RedNet50 | 15.5 | 2.7 | 78.33 | 94.17 |
| RedNet101 | 25.7 | 4.7 | 78.94 | 94.36 |
| RedNet152 | 34.0 | 6.8 | 79.17 | 94.40 |
\ No newline at end of file
| RedNet152 | 34.0 | 6.8 | 79.17 | 94.40 |
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| 模型 | Crop Size | Resize Short Size | time(ms)
<br>
bs=1 | time(ms)
<br>
bs=4 | time(ms)
<br/>
bs=8 |
| --------- | --------- | ----------------- | ---------------- | ---------------- | ----------------- |
| RedNet26 | 224 | 256 | 4.45 | 15.16 | 29.03 |
| RedNet38 | 224 | 256 | 6.24 | 21.39 | 41.26 |
| RedNet50 | 224 | 256 | 8.04 | 27.71 | 53.73 |
| RedNet101 | 224 | 256 | 13.07 | 44.12 | 83.28 |
| RedNet152 | 224 | 256 | 18.66 | 63.27 | 119.48 |
\ No newline at end of file
docs/zh_CN/models/ResNeSt_RegNet.md
浏览文件 @
a1ad2c89
...
...
@@ -4,7 +4,8 @@
*
[
1. 概述
](
#1
)
*
[
2. 精度、FLOPS 和参数量
](
#2
)
*
[
3. 基于 T4 GPU 的预测速度
](
#3
)
*
[
3. 基于 V100 GPU 的预测速度
](
#3
)
*
[
4. 基于 T4 GPU 的预测速度
](
#4
)
<a
name=
'1'
></a>
...
...
@@ -26,7 +27,17 @@ RegNet 是由 facebook 于 2020 年提出,旨在深化设计空间理念的概
<a
name=
'3'
></a>
## 3. 基于 T4 GPU 的预测速度
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| ---------------------- | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| ResNeSt50_fast_1s1x64d | 224 | 256 | 2.73 | 5.33 | 8.24 |
| ResNeSt50 | 224 | 256 | 7.36 | 10.23 | 13.84 |
| RegNetX_4GF | 224 | 256 | 6.46 | 8.48 | 11.45 |
<a
name=
'4'
></a>
## 4. 基于 T4 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP16
<br>
Batch Size=1
<br>
(ms) | FP16
<br>
Batch Size=4
<br>
(ms) | FP16
<br>
Batch Size=8
<br>
(ms) | FP32
<br>
Batch Size=1
<br>
(ms) | FP32
<br>
Batch Size=4
<br>
(ms) | FP32
<br>
Batch Size=8
<br>
(ms) |
|--------------------|-----------|-------------------|------------------------------|------------------------------|------------------------------|------------------------------|------------------------------|------------------------------|
...
...
docs/zh_CN/models/ResNet_and_vd.md
浏览文件 @
a1ad2c89
...
...
@@ -63,24 +63,24 @@ ResNet 系列模型是在 2015 年提出的,一举在 ILSVRC2015 比赛中取
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br>
Batch Size=1
<br>
(ms) |
|------------------|-----------|-------------------|--------------------------|
| ResNet18 | 224 | 256 | 1.
499
|
| ResNet18_vd | 224 | 256 | 1.
603
|
| ResNet34 | 224 | 256 |
2.272
|
| ResNet34_vd | 224 | 256 | 2.
343
|
| ResNet34_vd_ssld | 224 | 256 | 2.
343
|
| ResNet50 | 224 | 256 | 2.
939
|
| ResNet50_vc | 224 | 256 |
3.041
|
| ResNet50_vd | 224 | 256 |
3.165
|
| ResNet50_vd_v2 | 224 | 256 |
3.165
|
| ResNet101 | 224 | 256 |
5.314
|
| ResNet101_vd | 224 | 256 |
5.252
|
| ResNet152 | 224 | 256 |
7.205
|
| ResNet152_vd | 224 | 256 |
7.200
|
| ResNet200_vd | 224 | 256 |
8.885
|
| ResNet50_vd_ssld | 224 | 256 |
3.165
|
| ResNet101_vd_ssld | 224 | 256 |
5.252
|
| Models | Crop Size | Resize Short Size | FP32
<br>
Batch Size=1
<br>
(ms) |
FP32
<br/>
Batch Size=1
\4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
|------------------|-----------|-------------------|--------------------------|
--------------------------|--------------------------|
| ResNet18 | 224 | 256 | 1.
22 | 2.19 | 3.63
|
| ResNet18_vd | 224 | 256 | 1.
26 | 2.28 | 3.89
|
| ResNet34 | 224 | 256 |
1.97 | 3.25 | 5.70
|
| ResNet34_vd | 224 | 256 | 2.
00 | 3.28 | 5.84
|
| ResNet34_vd_ssld | 224 | 256 | 2.
00 | 3.26 | 5.85
|
| ResNet50 | 224 | 256 | 2.
54 | 4.79 | 7.40
|
| ResNet50_vc | 224 | 256 |
2.57 | 4.83 | 7.52
|
| ResNet50_vd | 224 | 256 |
2.60 | 4.86 | 7.63
|
| ResNet50_vd_v2 | 224 | 256 |
2.59 | 4.86 | 7.59
|
| ResNet101 | 224 | 256 |
4.37 | 8.18 | 12.38
|
| ResNet101_vd | 224 | 256 |
4.43 | 8.25 | 12.60
|
| ResNet152 | 224 | 256 |
6.05 | 11.41 | 17.33
|
| ResNet152_vd | 224 | 256 |
6.11 | 11.51 | 17.59
|
| ResNet200_vd | 224 | 256 |
7.70 | 14.57 | 22.16
|
| ResNet50_vd_ssld | 224 | 256 |
2.59 | 4.87 | 7.62
|
| ResNet101_vd_ssld | 224 | 256 |
4.43 | 8.25 | 12.58
|
<a
name=
'4'
></a>
...
...
docs/zh_CN/models/SEResNext_and_Res2Net.md
浏览文件 @
a1ad2c89
...
...
@@ -71,32 +71,35 @@ Res2Net 是 2019 年提出的一种全新的对 ResNet 的改进方案,该方
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br>
Batch Size=1
<br>
(ms) |
|-----------------------|-----------|-------------------|--------------------------|
| Res2Net50_26w_4s | 224 | 256 | 4.148 |
| Res2Net50_vd_26w_4s | 224 | 256 | 4.172 |
| Res2Net50_14w_8s | 224 | 256 | 5.113 |
| Res2Net101_vd_26w_4s | 224 | 256 | 7.327 |
| Res2Net200_vd_26w_4s | 224 | 256 | 12.806 |
| ResNeXt50_32x4d | 224 | 256 | 10.964 |
| ResNeXt50_vd_32x4d | 224 | 256 | 7.566 |
| ResNeXt50_64x4d | 224 | 256 | 13.905 |
| ResNeXt50_vd_64x4d | 224 | 256 | 14.321 |
| ResNeXt101_32x4d | 224 | 256 | 14.915 |
| ResNeXt101_vd_32x4d | 224 | 256 | 14.885 |
| ResNeXt101_64x4d | 224 | 256 | 28.716 |
| ResNeXt101_vd_64x4d | 224 | 256 | 28.398 |
| ResNeXt152_32x4d | 224 | 256 | 22.996 |
| ResNeXt152_vd_32x4d | 224 | 256 | 22.729 |
| ResNeXt152_64x4d | 224 | 256 | 46.705 |
| ResNeXt152_vd_64x4d | 224 | 256 | 46.395 |
| SE_ResNet18_vd | 224 | 256 | 1.694 |
| SE_ResNet34_vd | 224 | 256 | 2.786 |
| SE_ResNet50_vd | 224 | 256 | 3.749 |
| SE_ResNeXt50_32x4d | 224 | 256 | 8.924 |
| SE_ResNeXt50_vd_32x4d | 224 | 256 | 9.011 |
| SE_ResNeXt101_32x4d | 224 | 256 | 19.204 |
| SENet154_vd | 224 | 256 | 50.406 |
| Models | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
|-----------------------|-----------|-------------------|-----------------------|-----------------------|-----------------------|
| Res2Net50_26w_4s | 224 | 256 | 3.52 | 6.23 | 9.30 |
| Res2Net50_vd_26w_4s | 224 | 256 | 3.59 | 6.35 | 9.50 |
| Res2Net50_14w_8s | 224 | 256 | 4.39 | 7.21 | 10.38 |
| Res2Net101_vd_26w_4s | 224 | 256 | 6.34 | 11.02 | 16.13 |
| Res2Net200_vd_26w_4s | 224 | 256 | 11.45 | 19.77 | 28.81 |
| ResNeXt50_32x4d | 224 | 256 | 5.07 | 8.49 | 12.02 |
| ResNeXt50_vd_32x4d | 224 | 256 | 5.29 | 8.68 | 12.33 |
| ResNeXt50_64x4d | 224 | 256 | 9.39 | 13.97 | 20.56 |
| ResNeXt50_vd_64x4d | 224 | 256 | 9.75 | 14.14 | 20.84 |
| ResNeXt101_32x4d | 224 | 256 | 11.34 | 16.78 | 22.80 |
| ResNeXt101_vd_32x4d | 224 | 256 | 11.36 | 17.01 | 23.07 |
| ResNeXt101_64x4d | 224 | 256 | 21.57 | 28.08 | 39.49 |
| ResNeXt101_vd_64x4d | 224 | 256 | 21.57 | 28.22 | 39.70 |
| ResNeXt152_32x4d | 224 | 256 | 17.14 | 25.11 | 33.79 |
| ResNeXt152_vd_32x4d | 224 | 256 | 16.99 | 25.29 | 33.85 |
| ResNeXt152_64x4d | 224 | 256 | 33.07 | 42.05 | 59.13 |
| ResNeXt152_vd_64x4d | 224 | 256 | 33.30 | 42.41 | 59.42 |
| SE_ResNet18_vd | 224 | 256 | 1.48 | 2.70 | 4.32 |
| SE_ResNet34_vd | 224 | 256 | 2.42 | 3.69 | 6.29 |
| SE_ResNet50_vd | 224 | 256 | 3.11 | 5.99 | 9.34 |
| SE_ResNeXt50_32x4d | 224 | 256 | 6.39 | 11.01 | 14.94 |
| SE_ResNeXt50_vd_32x4d | 224 | 256 | 7.04 | 11.57 | 16.01 |
| SE_ResNeXt101_32x4d | 224 | 256 | 13.31 | 21.85 | 28.77 |
| SENet154_vd | 224 | 256 | 34.83 | 51.22 | 69.74 |
| Res2Net50_vd_26w_4s_ssld | 224 | 256 | 3.58 | 6.35 | 9.52 |
| Res2Net101_vd_26w_4s_ssld | 224 | 256 | 6.33 | 11.02 | 16.11 |
| Res2Net200_vd_26w_4s_ssld | 224 | 256 | 11.47 | 19.75 | 28.83 |
<a
name=
'4'
></a>
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录