Update ResNet_and_vd.md

b12ae8cc · dyning · GitHub · 3f6a3f6f · b12ae8cc
隐藏空白更改
内联并排

Showing with 10 addition and 3 deletion

docs/zh_cn/models/ResNet_and_vd.md docs/zh_cn/models/ResNet_and_vd.md +10 -3

未找到文件。
--- a/docs/zh_cn/models/ResNet_and_vd.md
+++ b/docs/zh_cn/models/ResNet_and_vd.md
@@ -2,12 +2,19 @@

 ## 概述

-![](../../images/models/ResNet.png)
+ResNet系列模型是在2015年提出的，一举在ILSVRC2015比赛中取得冠军，top5错误率为3.57%。该网络创新性的提出了残差结构，通过堆叠多个残差结构从而构建了ResNet网络。实验表明使用残差块可以有效地提升收敛速度和精度。
+
+斯坦福大学的Joyce Xu将ResNet称为「真正重新定义了我们看待神经网络的方式」的三大架构之一。由于ResNet卓越的性能，越来越多的来自学术界和工业界学者和工程师对其结构进行了改进，比较出名的有Wide-ResNet, ResNet-vc ,ResNet-vd, Res2Net等，其中ResNet-vc与ResNet-vd的参数量和计算量与ResNet几乎一致，所以在此我们将其与ResNet统一归为ResNet系列。
+
+本次发布ResNet系列的模型包括ResNet50，ResNet50_vd，ResNet50_vd_ssld，ResNet200_vd等14个预训练模型。在训练层面上，ResNet的模型采用了训练ImageNet的标准训练流程，而其余改进版模型采用了更多的训练策略，如learning rate的下降方式采用了cosine decay，引入了label smoothing的标签正则方式，在数据预处理加入了mixup的操作，迭代总轮数从120个epoch增加到200个epoch。

-所有模型在预测时，图像的crop_size设置为224，resize_short_size设置为256。
+其中，ResNet50_vd_v2与ResNet50_vd_ssld采用了知识蒸馏，保证模型结构不变的情况下，进一步提升了模型的精度，具体地，ResNet50_vd_v2的teacher模型是ResNet152_vd（top1准确率80.59%），数据选用的是ImageNet-1k的训练集，ResNet50_vd_ssld的teacher模型是ResNeXt101_32x16d_wsl（top1准确率84.2%），数据选用结合了ImageNet-1k的训练集和ImageNet-22k挖掘的400万数据。知识蒸馏的具体方法正在持续更新中。
+
+![](../../images/models/ResNet.png)

-更多的模型概述正在持续更新中。
+通过上述曲线可以看出，层数越多，准确率越高，但是相应的参数量、计算量和延时都会增加。ResNet50_vd_ssld通过用更强的teacher和更多的数据，将其在ImageNet-1k上的验证集top-1精度进一步提高，达到了82.39%，刷新了ResNet50系列模型的精度。

+- [x] 注意：所有模型在预测时，图像的crop_size设置为224，resize_short_size设置为256。

 ## 精度、FLOPS和参数量