HarDNet.md 2.1 KB
Newer Older
1
# HarDNet 系列
S
sibo2rr 已提交
2 3
---
## 目录
jm_12138's avatar
jm_12138 已提交
4

S
sibo2rr 已提交
5 6
* [1. 概述](#1)
* [2. 精度、FLOPS 和参数量](#2)
S
sibo2rr 已提交
7
* [3. 基于 V100 GPU 的预测速度](#3)
jm_12138's avatar
jm_12138 已提交
8

S
sibo2rr 已提交
9 10
 <a name='1'></a>
## 1. 概述
jm_12138's avatar
jm_12138 已提交
11

S
sibo2rr 已提交
12 13 14 15 16
HarDNet(Harmonic DenseNet)是 2019 年由国立清华大学提出的一种全新的神经网络,在低 MAC 和内存流量的条件下实现了高效率。与 FC-DenseNet-103,DenseNet-264,ResNet-50,ResNet-152 和 SSD-VGG 相比,新网络的推理时间减少了 35%,36%,30%,32% 和 45%。我们使用了包括 Nvidia Profiler 和 ARM Scale-Sim 在内的工具来测量内存流量,并验证推理延迟确实与内存流量消耗成正比,并且所提议的网络消耗的内存流量很低。[论文地址](https://arxiv.org/abs/1909.00948)

 <a name='2'></a>

## 2. 精度、FLOPS 和参数量
jm_12138's avatar
jm_12138 已提交
17 18 19 20 21 22 23

|         Model        | Params (M) | FLOPs (G) | Top-1 (%) | Top-5 (%) |
|:---------------------:|:----------:|:---------:|:---------:|:---------:|
| HarDNet68        | 17.6       | 4.3       | 75.46     | 92.65    |
| HarDNet85          | 36.7       | 9.1       | 77.44     |  93.55    |
| HarDNet39_ds       |  3.5       | 0.4       | 71.33     |  89.98    |
| HarDNet68_ds       |  4.2       | 0.8       | 73.62     |  91.52    |
S
sibo2rr 已提交
24 25 26 27 28 29 30 31 32 33 34

<a name='3'></a>

## 3. 基于 V100 GPU 的预测速度

| Models       | Crop Size | Resize Short Size | FP32<br/>Batch Size=1<br/>(ms) | FP32<br/>Batch Size=4<br/>(ms) | FP32<br/>Batch Size=8<br/>(ms) |
| ------------ | --------- | ----------------- | ------------------------------ | ------------------------------ | ------------------------------ |
| HarDNet68    | 224       | 256               | 3.58                           | 8.53                           | 11.58                          |
| HarDNet85    | 224       | 256               | 6.24                           | 14.85                          | 20.57                          |
| HarDNet39_ds | 224       | 256               | 1.40                           | 2.30                           | 3.33                           |
| HarDNet68_ds | 224       | 256               | 2.26                           | 3.34                           | 5.06                           |