diff --git a/docs/zh_CN/models/GhostNet.md b/docs/zh_CN/models/GhostNet.md
index 8f6935cfebbdd91f05e01979dc056c2b50246ea0..c5f7cfeeb4ba8a3cfe53e2ea49832f921635ee18 100644
--- a/docs/zh_CN/models/GhostNet.md
+++ b/docs/zh_CN/models/GhostNet.md
@@ -7,9 +7,8 @@
- [1.1 模型简介](#1.1)
- [1.2 模型指标](#1.2)
- [1.3 Benchmark](#1.3)
- - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+ - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
- [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
- - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
- [2. 模型快速体验](#2)
- [3. 模型训练、评估和预测](#3)
- [4. 模型推理部署](#4)
@@ -78,19 +77,6 @@ GhostNet 是华为于 2020 年提出的一种全新的轻量化网络结构,
**备注:** 精度类型为 FP32,推理过程使用 TensorRT。
-
-
-#### 1.3.3 基于 T4 GPU 的预测速度
-
-| Models | Size | Latency(ms)
FP32
bs=1 | Latency(ms)
FP32
bs=4 | Latency(ms)
FP32
bs=8 |
-|-----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| GhostNet_x0_5 | 224 | 1.66 | 2.24 | 2.73 |
-| GhostNet_x1_0 | 224 | 1.69 | 2.73 | 3.81 |
-| GhostNet_x1_3 | 224 | 1.84 | 2.88 | 3.94 |
-| GhostNet_x1_3_ssld | 224 | 1.85 | 3.17 | 4.29 |
-
-**备注:** 推理过程使用 TensorRT。
-
## 2. 模型快速体验
diff --git a/docs/zh_CN/models/MobileNetV1.md b/docs/zh_CN/models/MobileNetV1.md
index 2d45736c0cb879811fb2031a01fccde3f0b3a249..384529d307123a25743492729bd825d4b07591c7 100644
--- a/docs/zh_CN/models/MobileNetV1.md
+++ b/docs/zh_CN/models/MobileNetV1.md
@@ -7,9 +7,8 @@
- [1.1 模型简介](#1.1)
- [1.2 模型指标](#1.2)
- [1.3 Benchmark](#1.3)
- - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+ - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
- [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
- - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
- [2. 模型快速体验](#2)
- [3. 模型训练、评估和预测](#3)
- [4. 模型推理部署](#4)
@@ -53,6 +52,18 @@ MobileNetV1 是 Google 于 2017 年发布的用于移动设备或嵌入式设备
| MobileNetV1 | 0.710 | 0.897 | 0.706 | | 1.110 | 4.190 |
| MobileNetV1_ssld | 0.779 | 0.939 | | | 1.110 | 4.190 |
+
+
+#### 1.3.1 基于 SD855 的预测速度和存储大小
+
+| Models | SD855 time(ms)
bs=1, thread=1 | SD855 time(ms)
bs=1, thread=2 | SD855 time(ms)
bs=1, thread=4 | Storage Size(M) |
+|:--:|----|----|----|----|
+| MobileNetV1_x0_25 | 2.88 | 1.82 | 1.26 | 1.900 |
+| MobileNetV1_x0_5 | 8.74 | 5.26 | 3.09 | 5.200 |
+| MobileNetV1_x0_75 | 17.84 | 10.61 | 6.21 | 10.000 |
+| MobileNetV1 | 30.24 | 17.86 | 10.30 | 16.000 |
+| MobileNetV1_ssld | 30.19 | 17.85 | 10.23 | 16.000 |
+
#### 1.3.2 基于 V100 GPU 的预测速度
@@ -67,20 +78,6 @@ MobileNetV1 是 Google 于 2017 年发布的用于移动设备或嵌入式设备
**备注:** 精度类型为 FP32,推理过程使用 TensorRT。
-
-
-#### 1.3.2 基于 T4 GPU 的预测速度
-
-| Models | Size| Latency(ms)
FP32
bs=1 | Latency(ms)
FP32
bs=4 | Latency(ms)
FP32
bs=8 |
-|-----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| MobileNetV1_x0_25 | 224 | 0.47 | 0.93 | 1.39 |
-| MobileNetV1_x0_5 | 224 | 0.48 | 1.09 | 1.69 |
-| MobileNetV1_x0_75 | 224 | 0.55 | 1.34 | 2.03 |
-| MobileNetV1 | 224 | 0.64 | 1.57 | 2.48 |
-| MobileNetV1_ssld | 224 | 0.66 | 1.59 | 2.58 |
-
-**备注:** 推理过程使用 TensorRT。
-
## 2. 模型快速体验
diff --git a/docs/zh_CN/models/MobileNetV2.md b/docs/zh_CN/models/MobileNetV2.md
index 39e127eb817edc8f2e4b6ff7d234e5e5a2048665..ead0dcbb02673bf1ad8643826ffa5e75c2e00903 100644
--- a/docs/zh_CN/models/MobileNetV2.md
+++ b/docs/zh_CN/models/MobileNetV2.md
@@ -7,9 +7,8 @@
- [1.1 模型简介](#1.1)
- [1.2 模型指标](#1.2)
- [1.3 Benchmark](#1.3)
- - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+ - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
- [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
- - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
- [2. 模型快速体验](#2)
- [3. 模型训练、评估和预测](#3)
- [4. 模型推理部署](#4)
@@ -87,22 +86,6 @@ MobileNetV2 是 Google 继 MobileNetV1 提出的一种轻量级网络。相比 M
**备注:** 精度类型为 FP32,推理过程使用 TensorRT。
-
-
-#### 1.3.3 基于 T4 GPU 的预测速度
-
-| Models | Size | Latency(ms)
FP32
bs=1 | Latency(ms)
FP32
bs=4 | Latency(ms)
FP32
bs=8 |
-|----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| MobileNetV2_x0_25 | 224 | 0.83 | 1.17 | 1.78 |
-| MobileNetV2_x0_5 | 224 | 0.84 | 1.45 | 2.04 |
-| MobileNetV2_x0_75 | 224 | 0.96 | 1.62 | 2.53 |
-| MobileNetV2 | 224 | 1.02 | 1.93 | 2.89 |
-| MobileNetV2_x1_5 | 224 | 1.32 | 2.58 | 4.14 |
-| MobileNetV2_x2_0 | 224 | 1.57 | 3.13 | 4.76 |
-| MobileNetV2_ssld | 224 | 1.01 | 1.97 | 2.84 |
-
-**备注:** 推理过程使用 TensorRT。
-
## 2. 模型快速体验
diff --git a/docs/zh_CN/models/MobileNetV3.md b/docs/zh_CN/models/MobileNetV3.md
index 6f317b4b130c32b8873b74025066802f54c143b0..d51d798e748a94ad7b14bf4cf6c1890386ce0e99 100644
--- a/docs/zh_CN/models/MobileNetV3.md
+++ b/docs/zh_CN/models/MobileNetV3.md
@@ -7,9 +7,8 @@
- [1.1 模型简介](#1.1)
- [1.2 模型指标](#1.2)
- [1.3 Benchmark](#1.3)
- - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+ - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
- [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
- - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
- [2. 模型快速体验](#2)
- [3. 模型训练、评估和预测](#3)
- [4. 模型推理部署](#4)
@@ -108,27 +107,6 @@ ShuffleNet 系列网络是旷视提出的轻量化网络结构,到目前为止
**备注:** 精度类型为 FP32,推理过程使用 TensorRT。
-
-
-#### 1.3.3 基于 T4 GPU 的预测速度
-
-| Models | Size | Latency(ms)
FP32
bs=1 | Latency(ms)
FP32
bs=4 | Latency(ms)
FP32
bs=8 |
-|-----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| MobileNetV3_small_x0_35 | 224 | 1.01 | 1.44 | 1.92 |
-| MobileNetV3_small_x0_5 | 224 | 1.01 | 1.49 | 2.01 |
-| MobileNetV3_small_x0_75 | 224 | 1.04 | 1.71 | 2.37 |
-| MobileNetV3_small_x1_0 | 224 | 1.03 | 1.76 | 2.50 |
-| MobileNetV3_small_x1_25 | 224 | 1.20 | 2.04 | 2.64 |
-| MobileNetV3_large_x0_35 | 224 | 1.10 | 1.74 | 2.34 |
-| MobileNetV3_large_x0_5 | 224 | 1.10 | 1.85 | 2.69 |
-| MobileNetV3_large_x0_75 | 224 | 1.37 | 2.23 | 3.17 |
-| MobileNetV3_large_x1_0 | 224 | 1.37 | 2.67 | 3.46 |
-| MobileNetV3_large_x1_25 | 224 | 1.75 | 2.87 | 4.23 |
-| MobileNetV3_small_x1_0_ssld | 224 | 1.06 | 1.89 | 2.48 |
-| MobileNetV3_large_x1_0_ssld | 224 | 1.35 | 2.47 | 3.72 |
-
-**备注:** 推理过程使用 TensorRT。
-
## 2. 模型快速体验
diff --git a/docs/zh_CN/models/ShuffleNetV2.md b/docs/zh_CN/models/ShuffleNetV2.md
index f111cb6307cadeaee2f82df7bfb0ee6cc09750ed..bb811e8618b56373325e8e8119f596d727633eb9 100644
--- a/docs/zh_CN/models/ShuffleNetV2.md
+++ b/docs/zh_CN/models/ShuffleNetV2.md
@@ -7,9 +7,8 @@
- [1.1 模型简介](#1.1)
- [1.2 模型指标](#1.2)
- [1.3 Benchmark](#1.3)
- - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+ - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
- [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
- - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
- [2. 模型快速体验](#2)
- [3. 模型训练、评估和预测](#3)
- [4. 模型推理部署](#4)
@@ -87,22 +86,6 @@ ShuffleNet 系列网络是旷视提出的轻量化网络结构,到目前为止
**备注:** 精度类型为 FP32,推理过程使用 TensorRT。
-
-
-#### 1.3.3 基于 T4 GPU 的预测速度
-
-| Models | Size | Latency(ms)
FP32
bs=1 | Latency(ms)
FP32
bs=4 | Latency(ms)
FP32
bs=8 |
-|-----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| ShuffleNetV2_swish | 224 | 1.43 | 1.93 | 2.69 |
-| ShuffleNetV2_x0_25 | 224 | 0.92 | 1.27 | 1.73 |
-| ShuffleNetV2_x0_33 | 224 | 0.91 | 1.29 | 1.81 |
-| ShuffleNetV2_x0_5 | 224 | 0.89 | 1.43 | 1.94 |
-| ShuffleNetV2_x1_0 | 224 | 1.05 | 1.76 | 2.37 |
-| ShuffleNetV2_x1_5 | 224 | 0.93 | 1.99 | 2.85 |
-| ShuffleNetV2_x2_0 | 224 | 1.45 | 2.70 | 3.35 |
-
-**备注:** 推理过程使用 TensorRT。
-
## 2. 模型快速体验