Add the doc

d3842699 · gaotingquan · 9e2a8e86 · d3842699 · d3842699
隐藏空白更改
内联并排

Showing with 34 addition and 0 deletion

docs/zh_CN/models/LeViT.md docs/zh_CN/models/LeViT.md +17 -0

docs/zh_CN/models/Twins.md docs/zh_CN/models/Twins.md +17 -0

未找到文件。
--- a/docs/zh_CN/models/LeViT.md
+++ b/docs/zh_CN/models/LeViT.md
+# LeViT
+
+## 概述
+LeViT是一种快速推理的、用于图像分类任务的混合神经网络。其设计之初考虑了网络模型在不同的硬件平台上的性能，因此能够更好地反映普遍应用的真实场景。通过大量实验，作者找到了卷积神经网络与Transformer体系更好的结合方式，并且提出了attention-based方法，用于整合Transformer中的位置信息编码。[论文地址](https://arxiv.org/abs/2104.01136)。
+
+## 精度、FLOPS和参数量
+
+| Models           | Top1 | Top5 | Reference<br>top1 | Reference<br>top5 | FLOPS<br>(G) | Params<br>(M) |
+|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
+| LeViT-128S | 0.7621 | 0.9277 | 0.766 | 0.929 | 305  | 7.8 |
+| LeViT-128  | 0.7833 | 0.9378 | 0.786 | 0.940 | 406  | 9.2 |
+| LeViT-192  | 0.7963 | 0.9460 | 0.800 | 0.947 | 658  | 11 |
+| LeViT-256  | 0.7963 | 0.9460 | 0.816 | 0.954 | 1120 | 19 |
+| LeViT-384  | 0.8234 | 0.9587 | 0.826 | 0.960 | 2353 | 39 |
+
+
+**注**：与Reference的精度差异源于数据预处理不同。
--- a/docs/zh_CN/models/Twins.md
+++ b/docs/zh_CN/models/Twins.md
+# Twins
+
+## 概述
+Twins网络包括Twins-PCPVT和Twins-SVT，其重点对空间注意力机制进行了精心设计，得到了简单却更为有效的方案。由于该体系结构仅涉及矩阵乘法，而目前的深度学习框架中对矩阵乘法有较高的优化程度，因此该体系结构十分高效且易于实现。并且，该体系结构在图像分类、目标检测和语义分割等多种下游视觉任务中都能够取得优异的性能。[论文地址](https://arxiv.org/abs/2104.13840)。
+
+## 精度、FLOPS和参数量
+
+| Models        | Top1 | Top5 | Reference<br>top1 | Reference<br>top5 | FLOPS<br>(G) | Params<br>(M) |
+|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
+| pcpvt_small   | 0.8082 | 0.9552 | 0.812 | - | 3.7 | 24.1   |
+| pcpvt_base    | 0.8242 | 0.9619 | 0.827 | - | 6.4 | 43.8   |
+| pcpvt_large   | 0.8273 | 0.9650 | 0.831 | - | 9.5 | 60.9   |
+| alt_gvt_small | 0.8140 | 0.9546 | 0.817 | - | 2.8  | 24   |
+| alt_gvt_base  | 0.8294 | 0.9621 | 0.832 | - | 8.3  | 56   |
+| alt_gvt_large | 0.8331 | 0.9642 | 0.837 | - | 14.8 | 99.2   |
+
+**注**：与Reference的精度差异源于数据预处理不同。