Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
59e5f7c6
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
1 年多 前同步成功
通知
115
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
59e5f7c6
编写于
6月 07, 2022
作者:
C
cuicheng01
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update PP-LCNet.md
上级
237c1bc3
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
10 addition
and
10 deletion
+10
-10
docs/zh_CN/models/PP-LCNet.md
docs/zh_CN/models/PP-LCNet.md
+10
-10
未找到文件。
docs/zh_CN/models/PP-LCNet.md
浏览文件 @
59e5f7c6
...
...
@@ -72,7 +72,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
| SE Location | Top-1 Acc(
\%
) | Latency(ms) |
|
-------------------|---------------|-------------
|
|
:--:|:--:|:--:
|
| 1100000000000 | 61.73 | 2.06 |
| 0000001100000 | 62.17 | 2.03 |
|
<b>
0000000000011
<b>
|
<b>
63.14
<b>
|
<b>
2.05
<b>
|
...
...
@@ -88,7 +88,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
在 MixNet 的论文中,作者分析了卷积核大小对模型性能的影响,结论是在一定范围内大的卷积核可以提升模型的性能,但是超过这个范围会有损模型的性能,所以作者组合了一种 split-concat 范式的 MixConv,这种组合虽然可以提升模型的性能,但是不利于推理。我们通过实验总结了一些更大的卷积核在不同位置的作用,类似 SE 模块的位置,更大的卷积核在网络的中后部作用更明显,下表展示了 5x5 卷积核的位置对精度的影响:
| large-kernel Location | Top-1 Acc(
\%
) | Latency(ms) |
|
-------------------|---------------|-------------
|
|
:--:|:--:|:--:
|
| 1111111111111 | 63.22 | 2.08 |
| 1111111000000 | 62.70 | 2.07 |
|
<b>
0000001111111
<b>
|
<b>
63.14
<b>
|
<b>
2.05
<b>
|
...
...
@@ -104,7 +104,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步说明了每个方案对结果的影响:
| Activation | SE-block | Large-kernel | last-1x1-conv | Top-1 Acc(
\%
) | Latency(ms) |
|
------------|----------|--------------|---------------|---------------|-------------
|
|
:--:|:--:|:--:|:--:|:--:|:--:
|
| 0 | 1 | 1 | 1 | 61.93 | 1.94 |
| 1 | 0 | 1 | 1 | 62.51 | 1.87 |
| 1 | 1 | 0 | 1 | 62.44 | 2.01 |
...
...
@@ -122,7 +122,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
图像分类我们选用了 ImageNet 数据集,相比目前主流的轻量级网络,PP-LCNet 在相同精度下可以获得更快的推理速度。当使用百度自研的 SSLD 蒸馏策略后,精度进一步提升,在 Intel cpu 端约 5ms 的推理速度下 ImageNet 的 Top-1 Acc 超过了 80%。
| Model | Params(M) | FLOPs(M) | Top-1 Acc(
\%
) | Top-5 Acc(
\%
) | Latency(ms) | 预训练模型下载地址 | inference模型下载地址 |
|
-------|-----------|----------|---------------|---------------|-------------|---------------|-------------
|
|
:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:
|
| PPLCNet_x0_25 | 1.5 | 18 | 51.86 | 75.65 | 1.74 |
[
下载链接
](
https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/legendary_models/PPLCNet_x0_25_pretrained.pdparams
)
|
[
下载链接
](
https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/inference/PPLCNet_x0_25_infer.tar
)
|
| PPLCNet_x0_35 | 1.6 | 29 | 58.09 | 80.83 | 1.92 |
[
下载链接
](
https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/legendary_models/PPLCNet_x0_35_pretrained.pdparams
)
|
[
下载链接
](
https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/inference/PPLCNet_x0_35_infer.tar
)
|
| PPLCNet_x0_5 | 1.9 | 47 | 63.14 | 84.66 | 2.05 |
[
下载链接
](
https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/legendary_models/PPLCNet_x0_5_pretrained.pdparams
)
|
[
下载链接
](
https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/inference/PPLCNet_x0_5_infer.tar
)
|
...
...
@@ -140,7 +140,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
与其他轻量级网络的性能对比:
| Model | Params(M) | FLOPs(M) | Top-1 Acc(
\%
) | Top-5 Acc(
\%
) | Latency(ms) |
|
-------|-----------|----------|---------------|---------------|-------------
|
|
:--:|:--:|:--:|:--:|:--:|:--:
|
| MobileNetV2_x0_25 | 1.5 | 34 | 53.21 | 76.52 | 2.47 |
| MobileNetV3_small_x0_35 | 1.7 | 15 | 53.03 | 76.37 | 3.02 |
| ShuffleNetV2_x0_33 | 0.6 | 24 | 53.73 | 77.05 | 4.30 |
...
...
@@ -161,7 +161,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
目标检测的方法我们选用了百度自研的 PicoDet,该方法主打轻量级目标检测场景,下表展示了在 COCO 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的结果的比较,无论在精度还是速度上,PP-LCNet 的优势都非常明显。
| Backbone | mAP(%) | Latency(ms) |
|
-------|-----------|----------
|
|
:--:|:--:|:--:
|
MobileNetV3_large_x0_35 | 19.2 | 8.1 |
<b>
PPLCNet_x0_5
<b>
|
<b>
20.3
<b>
|
<b>
6.0
<b>
|
MobileNetV3_large_x0_75 | 25.8 | 11.1 |
...
...
@@ -174,7 +174,7 @@ MobileNetV3_large_x0_75 | 25.8 | 11.1 |
语义分割的方法我们选用了 DeeplabV3+,下表展示了在 Cityscapes 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的比较,在精度和速度方面,PP-LCNet 的优势同样明显。
| Backbone | mIoU(%) | Latency(ms) |
|
-------|-----------|----------
|
|
:--:|:--:|:--:
|
MobileNetV3_large_x0_5 | 55.42 | 135 |
<b>
PPLCNet_x0_5
<b>
|
<b>
58.36
<b>
|
<b>
82
<b>
|
MobileNetV3_large_x0_75 | 64.53 | 151 |
...
...
@@ -189,7 +189,7 @@ MobileNetV3_large_x0_75 | 64.53 | 151 |
#### 1.4.1 基于Intel Xeon Gold 6148 的预测速度
| Model | Intel Xeon Gold 6148 time(ms)
<br/>
bs=1, thread=10 |
|
-------|-------------
|
|
:--:|:--:
|
| PPLCNet_x0_25 | 1.74 |
| PPLCNet_x0_35 | 1.92 |
| PPLCNet_x0_5 | 2.05 |
...
...
@@ -206,7 +206,7 @@ MobileNetV3_large_x0_75 | 64.53 | 151 |
#### 1.4.2 基于 V100 GPU 的预测速度
| Models | FP32
<br>
Batch Size=1
<br>
(ms) | FP32
<br/>
Batch Size=1
\4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
|
------------- | ---------------------------- | -------------------------------- | ------------------------------
|
|
:--: | :--:| :--: | :--:
|
| PPLCNet_x0_25 | 0.72 | 1.17 | 1.71 |
| PPLCNet_x0_35 | 0.69 | 1.21 | 1.82 |
| PPLCNet_x0_5 | 0.70 | 1.32 | 1.94 |
...
...
@@ -222,7 +222,7 @@ MobileNetV3_large_x0_75 | 64.53 | 151 |
#### 1.4.3 基于 SD855 的预测速度
| Models | SD855 time(ms)
<br>
bs=1, thread=1 | SD855 time(ms)
<br/>
bs=1, thread=2 | SD855 time(ms)
<br/>
bs=1, thread=4 |
|
------------- | -------------------------------- | --------------------------------- | ---------------------------------
|
|
:--: | :--: | :--: | :--:
|
| PPLCNet_x0_25 | 2.30 | 1.62 | 1.32 |
| PPLCNet_x0_35 | 3.15 | 2.11 | 1.64 |
| PPLCNet_x0_5 | 4.27 | 2.73 | 1.92 |
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录