提交 59e5f7c6 编写于 作者: C cuicheng01

update PP-LCNet.md

上级 237c1bc3
......@@ -72,7 +72,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
| SE Location | Top-1 Acc(\%) | Latency(ms) |
|-------------------|---------------|-------------|
|:--:|:--:|:--:|
| 1100000000000 | 61.73 | 2.06 |
| 0000001100000 | 62.17 | 2.03 |
| <b>0000000000011<b> | <b>63.14<b> | <b>2.05<b> |
......@@ -88,7 +88,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
在 MixNet 的论文中,作者分析了卷积核大小对模型性能的影响,结论是在一定范围内大的卷积核可以提升模型的性能,但是超过这个范围会有损模型的性能,所以作者组合了一种 split-concat 范式的 MixConv,这种组合虽然可以提升模型的性能,但是不利于推理。我们通过实验总结了一些更大的卷积核在不同位置的作用,类似 SE 模块的位置,更大的卷积核在网络的中后部作用更明显,下表展示了 5x5 卷积核的位置对精度的影响:
| large-kernel Location | Top-1 Acc(\%) | Latency(ms) |
|-------------------|---------------|-------------|
|:--:|:--:|:--:|
| 1111111111111 | 63.22 | 2.08 |
| 1111111000000 | 62.70 | 2.07 |
| <b>0000001111111<b> | <b>63.14<b> | <b>2.05<b> |
......@@ -104,7 +104,7 @@ SE 模块是 SENet 提出的一种通道注意力机制,可以有效提升模
BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步说明了每个方案对结果的影响:
| Activation | SE-block | Large-kernel | last-1x1-conv | Top-1 Acc(\%) | Latency(ms) |
|------------|----------|--------------|---------------|---------------|-------------|
|:--:|:--:|:--:|:--:|:--:|:--:|
| 0 | 1 | 1 | 1 | 61.93 | 1.94 |
| 1 | 0 | 1 | 1 | 62.51 | 1.87 |
| 1 | 1 | 0 | 1 | 62.44 | 2.01 |
......@@ -122,7 +122,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
图像分类我们选用了 ImageNet 数据集,相比目前主流的轻量级网络,PP-LCNet 在相同精度下可以获得更快的推理速度。当使用百度自研的 SSLD 蒸馏策略后,精度进一步提升,在 Intel cpu 端约 5ms 的推理速度下 ImageNet 的 Top-1 Acc 超过了 80%。
| Model | Params(M) | FLOPs(M) | Top-1 Acc(\%) | Top-5 Acc(\%) | Latency(ms) | 预训练模型下载地址 | inference模型下载地址 |
|-------|-----------|----------|---------------|---------------|-------------|---------------|-------------|
|:--:|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
| PPLCNet_x0_25 | 1.5 | 18 | 51.86 | 75.65 | 1.74 | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/legendary_models/PPLCNet_x0_25_pretrained.pdparams) | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/inference/PPLCNet_x0_25_infer.tar) |
| PPLCNet_x0_35 | 1.6 | 29 | 58.09 | 80.83 | 1.92 | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/legendary_models/PPLCNet_x0_35_pretrained.pdparams) | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/inference/PPLCNet_x0_35_infer.tar) |
| PPLCNet_x0_5 | 1.9 | 47 | 63.14 | 84.66 | 2.05 | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/legendary_models/PPLCNet_x0_5_pretrained.pdparams) | [下载链接](https://paddle-imagenet-models-name.bj.bcebos.com/dygraph/inference/PPLCNet_x0_5_infer.tar) |
......@@ -140,7 +140,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
与其他轻量级网络的性能对比:
| Model | Params(M) | FLOPs(M) | Top-1 Acc(\%) | Top-5 Acc(\%) | Latency(ms) |
|-------|-----------|----------|---------------|---------------|-------------|
|:--:|:--:|:--:|:--:|:--:|:--:|
| MobileNetV2_x0_25 | 1.5 | 34 | 53.21 | 76.52 | 2.47 |
| MobileNetV3_small_x0_35 | 1.7 | 15 | 53.03 | 76.37 | 3.02 |
| ShuffleNetV2_x0_33 | 0.6 | 24 | 53.73 | 77.05 | 4.30 |
......@@ -161,7 +161,7 @@ BaseNet 经过以上四个方面的改进,得到了 PP-LCNet。下表进一步
目标检测的方法我们选用了百度自研的 PicoDet,该方法主打轻量级目标检测场景,下表展示了在 COCO 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的结果的比较,无论在精度还是速度上,PP-LCNet 的优势都非常明显。
| Backbone | mAP(%) | Latency(ms) |
|-------|-----------|----------|
|:--:|:--:|:--:|
MobileNetV3_large_x0_35 | 19.2 | 8.1 |
<b>PPLCNet_x0_5<b> | <b>20.3<b> | <b>6.0<b> |
MobileNetV3_large_x0_75 | 25.8 | 11.1 |
......@@ -174,7 +174,7 @@ MobileNetV3_large_x0_75 | 25.8 | 11.1 |
语义分割的方法我们选用了 DeeplabV3+,下表展示了在 Cityscapes 数据集上、backbone 选用 PP-LCNet 与 MobileNetV3 的比较,在精度和速度方面,PP-LCNet 的优势同样明显。
| Backbone | mIoU(%) | Latency(ms) |
|-------|-----------|----------|
|:--:|:--:|:--:|
MobileNetV3_large_x0_5 | 55.42 | 135 |
<b>PPLCNet_x0_5<b> | <b>58.36<b> | <b>82<b> |
MobileNetV3_large_x0_75 | 64.53 | 151 |
......@@ -189,7 +189,7 @@ MobileNetV3_large_x0_75 | 64.53 | 151 |
#### 1.4.1 基于Intel Xeon Gold 6148 的预测速度
| Model | Intel Xeon Gold 6148 time(ms)<br/>bs=1, thread=10 |
|-------|-------------|
|:--:|:--:|
| PPLCNet_x0_25 | 1.74 |
| PPLCNet_x0_35 | 1.92 |
| PPLCNet_x0_5 | 2.05 |
......@@ -206,7 +206,7 @@ MobileNetV3_large_x0_75 | 64.53 | 151 |
#### 1.4.2 基于 V100 GPU 的预测速度
| Models | FP32<br>Batch Size=1<br>(ms) | FP32<br/>Batch Size=1\4<br/>(ms) | FP32<br/>Batch Size=8<br/>(ms) |
| ------------- | ---------------------------- | -------------------------------- | ------------------------------ |
| :--: | :--:| :--: | :--: |
| PPLCNet_x0_25 | 0.72 | 1.17 | 1.71 |
| PPLCNet_x0_35 | 0.69 | 1.21 | 1.82 |
| PPLCNet_x0_5 | 0.70 | 1.32 | 1.94 |
......@@ -222,7 +222,7 @@ MobileNetV3_large_x0_75 | 64.53 | 151 |
#### 1.4.3 基于 SD855 的预测速度
| Models | SD855 time(ms)<br>bs=1, thread=1 | SD855 time(ms)<br/>bs=1, thread=2 | SD855 time(ms)<br/>bs=1, thread=4 |
| ------------- | -------------------------------- | --------------------------------- | --------------------------------- |
| :--: | :--: | :--: | :--: |
| PPLCNet_x0_25 | 2.30 | 1.62 | 1.32 |
| PPLCNet_x0_35 | 3.15 | 2.11 | 1.64 |
| PPLCNet_x0_5 | 4.27 | 2.73 | 1.92 |
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册