Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
56c5f7ce
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
1 年多 前同步成功
通知
115
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
56c5f7ce
编写于
12月 14, 2021
作者:
S
sibo2rr
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add mobile speed
上级
b3488eb7
变更
2
展开全部
隐藏空白更改
内联
并排
Showing
2 changed file
with
42 addition
and
25 deletion
+42
-25
docs/zh_CN/algorithm_introduction/ImageNet_models.md
docs/zh_CN/algorithm_introduction/ImageNet_models.md
+20
-20
docs/zh_CN/models/PP-LCNet.md
docs/zh_CN/models/PP-LCNet.md
+22
-5
未找到文件。
docs/zh_CN/algorithm_introduction/ImageNet_models.md
浏览文件 @
56c5f7ce
此差异已折叠。
点击以展开。
docs/zh_CN/models/PP-LCNet.md
浏览文件 @
56c5f7ce
...
...
@@ -15,10 +15,12 @@
-
[
4.2 目标检测
](
#4.2
)
-
[
4.3 语义分割
](
#4.3
)
-
[
5. 基于 V100 GPU 的预测速度
](
#5
)
-
[
6. 总结
](
#6
)
-
[
7. 引用
](
#7
)
-
[
6. 基于 SD855 的预测速度
](
#6
)
-
[
7. 总结
](
#7
)
-
[
8. 引用
](
#8
)
<a
name=
"1"
></a>
## 1. 摘要
在计算机视觉领域中,骨干网络的好坏直接影响到整个视觉任务的结果。在之前的一些工作中,相关的研究者普遍将 FLOPs 或者 Params 作为优化目的,但是在工业界真实落地的场景中,推理速度才是考量模型好坏的重要指标,然而,推理速度和准确性很难兼得。考虑到工业界有很多基于 Intel CPU 的应用,所以我们本次的工作旨在使骨干网络更好的适应 Intel CPU,从而得到一个速度更快、准确率更高的轻量级骨干网络,与此同时,目标检测、语义分割等下游视觉任务的性能也同样得到提升。
...
...
@@ -167,13 +169,28 @@ MobileNetV3-large-0.75x | 25.8 | 11.1 |
<a
name=
"6"
></a>
## 6.
总结
## 6.
基于 SD855 的预测速度
PP-LCNet 没有像学术界那样死扣极致的 FLOPs 与 Params,而是着眼于分析如何添加对 Intel CPU 友好的模块来提升模型的性能,这样可以更好的平衡准确率和推理时间,其中的实验结论也很适合其他网络结构设计的研究者,同时也为 NAS 搜索研究者提供了更小的搜索空间和一般结论。最终的 PP-LCNet 在产业界也可以更好的落地和应用。
| Models | SD855 time(ms)
<br>
bs=1, thread=1 | SD855 time(ms)
<br/>
bs=1, thread=2 | SD855 time(ms)
<br/>
bs=1, thread=4 |
| ------------- | -------------------------------- | --------------------------------- | --------------------------------- |
| PPLCNet_x0_25 | 2.30 | 1.62 | 1.32 |
| PPLCNet_x0_35 | 3.15 | 2.11 | 1.64 |
| PPLCNet_x0_5 | 4.27 | 2.73 | 1.92 |
| PPLCNet_x0_75 | 7.38 | 4.51 | 2.91 |
| PPLCNet_x1_0 | 10.78 | 6.49 | 3.98 |
| PPLCNet_x1_5 | 20.55 | 12.26 | 7.54 |
| PPLCNet_x2_0 | 33.79 | 20.17 | 12.10 |
| PPLCNet_x2_5 | 49.89 | 29.60 | 17.82 |
<a
name=
"7"
></a>
## 7. 引用
## 7. 总结
PP-LCNet 没有像学术界那样死扣极致的 FLOPs 与 Params,而是着眼于分析如何添加对 Intel CPU 友好的模块来提升模型的性能,这样可以更好的平衡准确率和推理时间,其中的实验结论也很适合其他网络结构设计的研究者,同时也为 NAS 搜索研究者提供了更小的搜索空间和一般结论。最终的 PP-LCNet 在产业界也可以更好的落地和应用。
<a
name=
"8"
></a>
## 8. 引用
如果你的论文用到了 PP-LCNet 的方法,请添加如下 cite:
```
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录