Inception.md 6.9 KB
Newer Older
S
sibo2rr 已提交
1 2 3
# Inception 系列
-----
## 目录
W
WuHaobo 已提交
4

S
sibo2rr 已提交
5 6 7 8
* [1. 概述](#1)
* [2. 精度、FLOPS 和参数量](#2)
* [3. 基于 V100 GPU 的预测速度](#3)
* [4. 基于 T4 GPU 的预测速度](#4)
littletomatodonkey's avatar
littletomatodonkey 已提交
9

S
sibo2rr 已提交
10
<a name='1'></a>
littletomatodonkey's avatar
littletomatodonkey 已提交
11

S
sibo2rr 已提交
12
## 1. 概述
13

S
sibo2rr 已提交
14
GoogLeNet 是 2014 年由 Google 设计的一种新的神经网络结构,其与 VGG 网络并列成为当年 ImageNet 挑战赛的双雄。GoogLeNet 首次引入 Inception 结构,在网络中堆叠该结构使得网络层数达到了 22 层,这也是卷积网络首次超过 20 层的标志。由于在 Inception 结构中使用了 1x1 的卷积用于通道数降维,并且使用了 Global-pooling 代替传统的多 fc 层加工特征的方式,最终的 GoogLeNet 网络的 FLOPS 和参数量远小于 VGG 网络,成为当时神经网络设计的一道亮丽风景线。
littletomatodonkey's avatar
littletomatodonkey 已提交
15

S
sibo2rr 已提交
16
InceptionV3 是 Google 对 InceptionV2 的一种改进。首先,InceptionV3 对 Inception 模块进行了优化,同时设计和使用了更多种类的 Inception 模块,与此同时,InceptionV3 中的部分 Inception 模块将较大的方形二维卷积拆成两个较小的非对称卷积,这样可以大幅度节省参数量。
littletomatodonkey's avatar
littletomatodonkey 已提交
17

S
sibo2rr 已提交
18
Xception 是 Google 继 Inception 后提出的对 InceptionV3 的另一种改进。在 Xception 中,作者使用了深度可分离卷积代替了传统的卷积操作,该操作大大节省了网络的 FLOPS 和参数量,但是精度反而有所提升。在 DeeplabV3+ 中,作者将 Xception 做了进一步的改进,同时增加了 Xception 的层数,设计出了 Xception65 和 Xception71 的网络。
littletomatodonkey's avatar
littletomatodonkey 已提交
19

S
sibo2rr 已提交
20 21 22 23
InceptionV4 是 2016 年由 Google 设计的新的神经网络,当时残差结构风靡一时,但是作者认为仅使用 Inception 结构也可以达到很高的性能。InceptionV4 使用了更多的 Inception module,在 ImageNet 上的精度再创新高。


该系列模型的 FLOPS、参数量以及 T4 GPU 上的预测耗时如下图所示。
littletomatodonkey's avatar
littletomatodonkey 已提交
24

littletomatodonkey's avatar
littletomatodonkey 已提交
25
![](../../images/models/T4_benchmark/t4.fp32.bs4.Inception.flops.png)
littletomatodonkey's avatar
littletomatodonkey 已提交
26

littletomatodonkey's avatar
littletomatodonkey 已提交
27
![](../../images/models/T4_benchmark/t4.fp32.bs4.Inception.params.png)
littletomatodonkey's avatar
littletomatodonkey 已提交
28

littletomatodonkey's avatar
littletomatodonkey 已提交
29
![](../../images/models/T4_benchmark/t4.fp32.bs4.Inception.png)
W
WuHaobo 已提交
30

littletomatodonkey's avatar
littletomatodonkey 已提交
31 32
![](../../images/models/T4_benchmark/t4.fp16.bs4.Inception.png)

S
sibo2rr 已提交
33
上图反映了 Xception 系列和 InceptionV4 的精度和其他指标的关系。其中 Xception_deeplab 与论文结构保持一致,Xception 是 PaddleClas 的改进模型,在预测速度基本不变的情况下,精度提升约 0.6%。关于该改进模型的详细介绍正在持续更新中,敬请期待。
littletomatodonkey's avatar
littletomatodonkey 已提交
34

littletomatodonkey's avatar
littletomatodonkey 已提交
35

S
sibo2rr 已提交
36
 <a name='2'></a>
W
WuHaobo 已提交
37

S
sibo2rr 已提交
38
## 2. 精度、FLOPS 和参数量
W
WuHaobo 已提交
39 40 41 42 43 44 45 46 47

| Models             | Top1   | Top5   | Reference<br>top1 | Reference<br>top5 | FLOPS<br>(G) | Parameters<br>(M) |
|:--:|:--:|:--:|:--:|:--:|:--:|:--:|
| GoogLeNet          | 0.707  | 0.897  | 0.698             |                   | 2.880        | 8.460             |
| Xception41         | 0.793  | 0.945  | 0.790             | 0.945             | 16.740       | 22.690            |
| Xception41<br>_deeplab | 0.796  | 0.944  |                   |                   | 18.160       | 26.730            |
| Xception65         | 0.810  | 0.955  |                   |                   | 25.950       | 35.480            |
| Xception65<br>_deeplab | 0.803  | 0.945  |                   |                   | 27.370       | 39.520            |
| Xception71         | 0.811  | 0.955  |                   |                   | 31.770       | 37.280            |
48
| InceptionV3        | 0.791  | 0.946  | 0.788             | 0.944             | 11.460       | 23.830            |
W
WuHaobo 已提交
49 50 51
| InceptionV4        | 0.808  | 0.953  | 0.800             | 0.950             | 24.570       | 42.680            |


S
sibo2rr 已提交
52
 <a name='3'></a>
W
WuHaobo 已提交
53

S
sibo2rr 已提交
54
## 3. 基于 V100 GPU 的预测速度
W
WuHaobo 已提交
55

S
sibo2rr 已提交
56 57 58 59 60 61 62 63 64
| Models                 | Crop Size | Resize Short Size | FP32<br/>Batch Size=1<br/>(ms) | FP32<br/>Batch Size=4<br/>(ms) | FP32<br/>Batch Size=8<br/>(ms) |
|------------------------|-----------|-------------------|------------------------|------------------------|------------------------|
| GoogLeNet              | 224       | 256               | 1.41 | 3.25 | 5.00 |
| Xception41             | 299       | 320               | 3.58 | 8.76 | 16.61 |
| Xception41_<br>deeplab | 299       | 320               | 3.81 | 9.16 | 17.20 |
| Xception65             | 299       | 320               | 5.45 | 12.78 | 24.53 |
| Xception65_<br>deeplab | 299       | 320               | 5.65 | 13.08 | 24.61 |
| Xception71             | 299       | 320               | 6.19 | 15.34 | 29.21 |
| InceptionV4            | 299       | 320               | 8.93 | 15.17 | 21.56 |
littletomatodonkey's avatar
littletomatodonkey 已提交
65 66


S
sibo2rr 已提交
67
 <a name='4'></a>
littletomatodonkey's avatar
littletomatodonkey 已提交
68

S
sibo2rr 已提交
69
## 4. 基于 T4 GPU 的预测速度
littletomatodonkey's avatar
littletomatodonkey 已提交
70

littletomatodonkey's avatar
fix bs  
littletomatodonkey 已提交
71
| Models             | Crop Size | Resize Short Size | FP16<br>Batch Size=1<br>(ms) | FP16<br>Batch Size=4<br>(ms) | FP16<br>Batch Size=8<br>(ms) | FP32<br>Batch Size=1<br>(ms) | FP32<br>Batch Size=4<br>(ms) | FP32<br>Batch Size=8<br>(ms) |
littletomatodonkey's avatar
littletomatodonkey 已提交
72 73 74 75 76 77 78
|--------------------|-----------|-------------------|------------------------------|------------------------------|------------------------------|------------------------------|------------------------------|------------------------------|
| GoogLeNet          | 299       | 320               | 1.75451                      | 3.39931                      | 4.71909                      | 1.88038                      | 4.48882                      | 6.94035                      |
| Xception41         | 299       | 320               | 2.91192                      | 7.86878                      | 15.53685                     | 4.96939                      | 17.01361                     | 32.67831                     |
| Xception41_<br>deeplab | 299       | 320               | 2.85934                      | 7.2075                       | 14.01406                     | 5.33541                      | 17.55938                     | 33.76232                     |
| Xception65         | 299       | 320               | 4.30126                      | 11.58371                     | 23.22213                     | 7.26158                      | 25.88778                     | 53.45426                     |
| Xception65_<br>deeplab | 299       | 320               | 4.06803                      | 9.72694                      | 19.477                       | 7.60208                      | 26.03699                     | 54.74724                     |
| Xception71         | 299       | 320               | 4.80889                      | 13.5624                      | 27.18822                     | 8.72457                      | 31.55549                     | 69.31018                     |
79
| InceptionV3        | 299       | 320               | 3.67502                      | 6.36071                     | 9.82645                     | 6.64054                     | 13.53630                     | 22.17355                     |
littletomatodonkey's avatar
littletomatodonkey 已提交
80
| InceptionV4        | 299       | 320               | 9.50821                      | 13.72104                     | 20.27447                     | 12.99342                     | 25.23416                     | 43.56121                     |