Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
2b0daeff
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
1 年多 前同步成功
通知
115
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
2b0daeff
编写于
12月 15, 2021
作者:
S
sibo2rr
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add speed to vits
上级
54b72398
变更
4
展开全部
隐藏空白更改
内联
并排
Showing
4 changed file
with
118 addition
and
59 deletion
+118
-59
docs/zh_CN/algorithm_introduction/ImageNet_models.md
docs/zh_CN/algorithm_introduction/ImageNet_models.md
+59
-59
docs/zh_CN/models/SwinTransformer.md
docs/zh_CN/models/SwinTransformer.md
+18
-0
docs/zh_CN/models/Twins.md
docs/zh_CN/models/Twins.md
+14
-0
docs/zh_CN/models/ViT_and_DeiT.md
docs/zh_CN/models/ViT_and_DeiT.md
+27
-0
未找到文件。
docs/zh_CN/algorithm_introduction/ImageNet_models.md
浏览文件 @
2b0daeff
此差异已折叠。
点击以展开。
docs/zh_CN/models/SwinTransformer.md
浏览文件 @
2b0daeff
...
...
@@ -4,6 +4,7 @@
*
[
1. 概述
](
#1
)
*
[
2. 精度、FLOPS 和参数量
](
#2
)
*
[
3. 基于V100 GPU 的预测速度
](
#3
)
<a
name=
'1'
></a>
...
...
@@ -28,3 +29,20 @@ Swin Transformer 是一种新的视觉 Transformer 网络,可以用作计算
[1]:基于 ImageNet22k 数据集预训练,然后在 ImageNet1k 数据集迁移学习得到。
**注**
:与 Reference 的精度差异源于数据预处理不同。
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| ------------------------------------------------------- | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| SwinTransformer_tiny_patch4_window7_224 | 224 | 256 | 6.59 | 9.68 | 16.32 |
| SwinTransformer_small_patch4_window7_224 | 224 | 256 | 12.54 | 17.07 | 28.08 |
| SwinTransformer_base_patch4_window7_224 | 224 | 256 | 13.37 | 23.53 | 39.11 |
| SwinTransformer_base_patch4_window12_384 | 384 | 384 | 19.52 | 64.56 | 123.30 |
| SwinTransformer_base_patch4_window7_224
<sup>
[1]
</sup>
| 224 | 256 | 13.53 | 23.46 | 39.13 |
| SwinTransformer_base_patch4_window12_384
<sup>
[1]
</sup>
| 384 | 384 | 19.65 | 64.72 | 123.42 |
| SwinTransformer_large_patch4_window7_224
<sup>
[1]
</sup>
| 224 | 256 | 15.74 | 38.57 | 71.49 |
| SwinTransformer_large_patch4_window12_384
<sup>
[1]
</sup>
| 384 | 384 | 32.61 | 116.59 | 223.23 |
[1]:基于 ImageNet22k 数据集预训练,然后在 ImageNet1k 数据集迁移学习得到。
docs/zh_CN/models/Twins.md
浏览文件 @
2b0daeff
...
...
@@ -4,6 +4,7 @@
*
[
1. 概述
](
#1
)
*
[
2. 精度、FLOPS 和参数量
](
#2
)
*
[
3. 基于V100 GPU 的预测速度
](
#3
)
<a
name=
'1'
></a>
...
...
@@ -24,3 +25,16 @@ Twins 网络包括 Twins-PCPVT 和 Twins-SVT,其重点对空间注意力机制
| alt_gvt_large | 0.8331 | 0.9642 | 0.837 | - | 14.8 | 99.2 |
**注**
:与 Reference 的精度差异源于数据预处理不同。
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| ------------- | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| pcpvt_small | 224 | 256 | 7.32 | 10.51 | 15.27 |
| pcpvt_base | 224 | 256 | 12.20 | 16.22 | 23.16 |
| pcpvt_large | 224 | 256 | 16.47 | 22.90 | 32.73 |
| alt_gvt_small | 224 | 256 | 6.94 | 9.01 | 12.27 |
| alt_gvt_base | 224 | 256 | 9.37 | 15.02 | 24.54 |
| alt_gvt_large | 224 | 256 | 11.76 | 22.08 | 35.12 |
docs/zh_CN/models/ViT_and_DeiT.md
浏览文件 @
2b0daeff
...
...
@@ -4,6 +4,7 @@
*
[
1. 概述
](
#1
)
*
[
2. 精度、FLOPS 和参数量
](
#2
)
*
[
3. 基于V100 GPU 的预测速度
](
#3
)
<a
name=
'1'
></a>
...
...
@@ -41,3 +42,29 @@ DeiT(Data-efficient Image Transformers)系列模型是由 FaceBook 在 2020
| DeiT_base_distilled_patch16_384 | 0.851 | 0.973 | 0.852 | 0.972 | | |
关于 Params、FLOPs、Inference speed 等信息,敬请期待。
<a
name=
'3'
></a>
## 3. 基于 V100 GPU 的预测速度
| Models | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| -------------------------- | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| ViT_small_
<br/>
patch16_224 | 256 | 224 | 3.71 | 9.05 | 16.72 |
| ViT_base_
<br/>
patch16_224 | 256 | 224 | 6.12 | 14.84 | 28.51 |
| ViT_base_
<br/>
patch16_384 | 384 | 384 | 14.15 | 48.38 | 95.06 |
| ViT_base_
<br/>
patch32_384 | 384 | 384 | 4.94 | 13.43 | 24.08 |
| ViT_large_
<br/>
patch16_224 | 256 | 224 | 15.53 | 49.50 | 94.09 |
| ViT_large_
<br/>
patch16_384 | 384 | 384 | 39.51 | 152.46 | 304.06 |
| ViT_large_
<br/>
patch32_384 | 384 | 384 | 11.44 | 36.09 | 70.63 |
| Models | Crop Size | Resize Short Size | FP32
<br/>
Batch Size=1
<br/>
(ms) | FP32
<br/>
Batch Size=4
<br/>
(ms) | FP32
<br/>
Batch Size=8
<br/>
(ms) |
| ------------------------------------ | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| DeiT_tiny_
<br>
patch16_224 | 256 | 224 | 3.61 | 3.94 | 6.10 |
| DeiT_small_
<br>
patch16_224 | 256 | 224 | 3.61 | 6.24 | 10.49 |
| DeiT_base_
<br>
patch16_224 | 256 | 224 | 6.13 | 14.87 | 28.50 |
| DeiT_base_
<br>
patch16_384 | 384 | 384 | 14.12 | 48.80 | 97.60 |
| DeiT_tiny_
<br>
distilled_patch16_224 | 256 | 224 | 3.51 | 4.05 | 6.03 |
| DeiT_small_
<br>
distilled_patch16_224 | 256 | 224 | 3.70 | 6.20 | 10.53 |
| DeiT_base_
<br>
distilled_patch16_224 | 256 | 224 | 6.17 | 14.94 | 28.58 |
| DeiT_base_
<br>
distilled_patch16_384 | 384 | 384 | 14.12 | 48.76 | 97.09 |
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录