LeViT.md 1.2 KB
Newer Older
G
gaotingquan 已提交
1 2
# LeViT

S
sibo2rr 已提交
3 4
---
## 目录
G
gaotingquan 已提交
5

S
sibo2rr 已提交
6 7 8 9 10 11 12 13 14 15 16
* [1. 概述](#1)
* [2. 精度、FLOPS 和参数量](#2)

<a name='1'></a>

## 1. 概述
LeViT 是一种快速推理的、用于图像分类任务的混合神经网络。其设计之初考虑了网络模型在不同的硬件平台上的性能,因此能够更好地反映普遍应用的真实场景。通过大量实验,作者找到了卷积神经网络与 Transformer 体系更好的结合方式,并且提出了 attention-based 方法,用于整合 Transformer 中的位置信息编码。[论文地址](https://arxiv.org/abs/2104.01136)

<a name='2'></a>

## 2. 精度、FLOPS 和参数量
G
gaotingquan 已提交
17

C
cuicheng01 已提交
18
| Models           | Top1 | Top5 | Reference<br>top1 | Reference<br>top5 | FLOPS<br>(M) | Params<br>(M) |
G
gaotingquan 已提交
19
|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
C
cuicheng01 已提交
20
| LeViT-128S | 0.7598 | 0.9269 | 0.766 | 0.929 | 305  | 7.8 |
G
gaotingquan 已提交
21
| LeViT-128  | 0.7810 | 0.9372 | 0.786 | 0.940 | 406  | 9.2 |
C
cuicheng01 已提交
22
| LeViT-192  | 0.7934 | 0.9446 | 0.800 | 0.947 | 658  | 11 |
T
Fix  
Tingquan Gao 已提交
23
| LeViT-256  | 0.8085 | 0.9497 | 0.816 | 0.954 | 1120 | 19 |
C
cuicheng01 已提交
24
| LeViT-384  | 0.8191 | 0.9551 | 0.826 | 0.960 | 2353 | 39 |
G
gaotingquan 已提交
25 26


S
sibo2rr 已提交
27
**注**:与 Reference 的精度差异源于数据预处理不同及未使用蒸馏的 head 作为输出。