diff --git a/docs/zh_CN/models/GhostNet.md b/docs/zh_CN/models/GhostNet.md
index 8f6935cfebbdd91f05e01979dc056c2b50246ea0..c5f7cfeeb4ba8a3cfe53e2ea49832f921635ee18 100644
--- a/docs/zh_CN/models/GhostNet.md
+++ b/docs/zh_CN/models/GhostNet.md
@@ -7,9 +7,8 @@
     - [1.1 模型简介](#1.1)
     - [1.2 模型指标](#1.2)
     - [1.3 Benchmark](#1.3)
-      - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+      - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
       - [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
-      - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
 - [2. 模型快速体验](#2)
 - [3. 模型训练、评估和预测](#3)
 - [4. 模型推理部署](#4)
@@ -78,19 +77,6 @@ GhostNet 是华为于 2020 年提出的一种全新的轻量化网络结构，
 
 **备注：** 精度类型为 FP32，推理过程使用 TensorRT。
 
-<a name='1.3.3'></a>
-
-#### 1.3.3 基于 T4 GPU 的预测速度
-
-| Models            | Size | Latency(ms)<br>FP32<br>bs=1 | Latency(ms)<br>FP32<br>bs=4 | Latency(ms)<br>FP32<br>bs=8 |
-|-----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| GhostNet_x0_5               | 224     | 1.66                         | 2.24                         | 2.73                         |
-| GhostNet_x1_0               | 224     | 1.69                         | 2.73                         | 3.81                         |
-| GhostNet_x1_3               | 224     | 1.84                         | 2.88                         | 3.94                         |
-| GhostNet_x1_3_ssld          | 224     | 1.85                         | 3.17                         | 4.29                         |
-
-**备注：** 推理过程使用 TensorRT。
-
 <a name="2"></a>  
 
 ## 2. 模型快速体验
diff --git a/docs/zh_CN/models/MobileNetV1.md b/docs/zh_CN/models/MobileNetV1.md
index 2d45736c0cb879811fb2031a01fccde3f0b3a249..384529d307123a25743492729bd825d4b07591c7 100644
--- a/docs/zh_CN/models/MobileNetV1.md
+++ b/docs/zh_CN/models/MobileNetV1.md
@@ -7,9 +7,8 @@
     - [1.1 模型简介](#1.1)
     - [1.2 模型指标](#1.2)
     - [1.3 Benchmark](#1.3)
-      - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+      - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
       - [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
-      - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
 - [2. 模型快速体验](#2)
 - [3. 模型训练、评估和预测](#3)
 - [4. 模型推理部署](#4)
@@ -53,6 +52,18 @@ MobileNetV1 是 Google 于 2017 年发布的用于移动设备或嵌入式设备
 | MobileNetV1                          | 0.710   | 0.897   | 0.706             |                   | 1.110        | 4.190             |
 | MobileNetV1_ssld                     | 0.779   | 0.939   |                   |                   | 1.110        | 4.190             |
 
+<a name='1.3.1'></a>
+
+#### 1.3.1 基于 SD855 的预测速度和存储大小
+
+| Models                               | SD855 time(ms)<br>bs=1, thread=1 | SD855 time(ms)<br/>bs=1, thread=2 | SD855 time(ms)<br/>bs=1, thread=4 | Storage Size(M) |
+|:--:|----|----|----|----|
+| MobileNetV1_x0_25                    | 2.88        | 1.82        | 1.26        | 1.900           |
+| MobileNetV1_x0_5                     | 8.74        | 5.26        | 3.09        | 5.200           |
+| MobileNetV1_x0_75                    | 17.84      | 10.61      | 6.21       | 10.000          |
+| MobileNetV1                          | 30.24      | 17.86      | 10.30      | 16.000          |
+| MobileNetV1_ssld                     | 30.19      | 17.85      | 10.23      | 16.000          |
+
 <a name='1.3.2'></a>
 
 #### 1.3.2 基于 V100 GPU 的预测速度
@@ -67,20 +78,6 @@ MobileNetV1 是 Google 于 2017 年发布的用于移动设备或嵌入式设备
 
 **备注：** 精度类型为 FP32，推理过程使用 TensorRT。
 
-<a name='1.3.2'></a>
-
-#### 1.3.2 基于 T4 GPU 的预测速度
-
-| Models            | Size| Latency(ms)<br>FP32<br>bs=1 | Latency(ms)<br>FP32<br>bs=4 | Latency(ms)<br>FP32<br>bs=8 |
-|-----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| MobileNetV1_x0_25           | 224       | 0.47                         | 0.93                         | 1.39                         |
-| MobileNetV1_x0_5            | 224       | 0.48                         | 1.09                         | 1.69                         |
-| MobileNetV1_x0_75           | 224       | 0.55                         | 1.34                         | 2.03                         |
-| MobileNetV1                 | 224       | 0.64                         | 1.57                         | 2.48                         |
-| MobileNetV1_ssld            | 224       | 0.66                         | 1.59                         | 2.58                         |
-
-**备注：** 推理过程使用 TensorRT。
-
 <a name="2"></a>  
 
 ## 2. 模型快速体验
diff --git a/docs/zh_CN/models/MobileNetV2.md b/docs/zh_CN/models/MobileNetV2.md
index 39e127eb817edc8f2e4b6ff7d234e5e5a2048665..ead0dcbb02673bf1ad8643826ffa5e75c2e00903 100644
--- a/docs/zh_CN/models/MobileNetV2.md
+++ b/docs/zh_CN/models/MobileNetV2.md
@@ -7,9 +7,8 @@
     - [1.1 模型简介](#1.1)
     - [1.2 模型指标](#1.2)
     - [1.3 Benchmark](#1.3)
-      - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+      - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
       - [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
-      - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
 - [2. 模型快速体验](#2)
 - [3. 模型训练、评估和预测](#3)
 - [4. 模型推理部署](#4)
@@ -87,22 +86,6 @@ MobileNetV2 是 Google 继 MobileNetV1 提出的一种轻量级网络。相比 M
 
 **备注：** 精度类型为 FP32，推理过程使用 TensorRT。
 
-<a name='1.3.3'></a>
-
-#### 1.3.3 基于 T4 GPU 的预测速度
-
-| Models            | Size | Latency(ms)<br>FP32<br>bs=1 | Latency(ms)<br>FP32<br>bs=4 | Latency(ms)<br>FP32<br>bs=8 |
-|----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| MobileNetV2_x0_25           | 224      | 0.83                         | 1.17                         | 1.78                         |
-| MobileNetV2_x0_5            | 224      | 0.84                         | 1.45                         | 2.04                         |
-| MobileNetV2_x0_75           | 224      | 0.96                         | 1.62                         | 2.53                         |
-| MobileNetV2                 | 224      | 1.02                         | 1.93                         | 2.89                         |
-| MobileNetV2_x1_5            | 224      | 1.32                         | 2.58                         | 4.14                         |
-| MobileNetV2_x2_0            | 224      | 1.57                         | 3.13                         | 4.76                         |
-| MobileNetV2_ssld            | 224      | 1.01                         | 1.97                         | 2.84                         |
-
-**备注：** 推理过程使用 TensorRT。
-
 <a name="2"></a>  
 
 ## 2. 模型快速体验
diff --git a/docs/zh_CN/models/MobileNetV3.md b/docs/zh_CN/models/MobileNetV3.md
index 6f317b4b130c32b8873b74025066802f54c143b0..d51d798e748a94ad7b14bf4cf6c1890386ce0e99 100644
--- a/docs/zh_CN/models/MobileNetV3.md
+++ b/docs/zh_CN/models/MobileNetV3.md
@@ -7,9 +7,8 @@
     - [1.1 模型简介](#1.1)
     - [1.2 模型指标](#1.2)
     - [1.3 Benchmark](#1.3)
-      - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+      - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
       - [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
-      - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
 - [2. 模型快速体验](#2)
 - [3. 模型训练、评估和预测](#3)
 - [4. 模型推理部署](#4)
@@ -108,27 +107,6 @@ ShuffleNet 系列网络是旷视提出的轻量化网络结构，到目前为止
 
 **备注：** 精度类型为 FP32，推理过程使用 TensorRT。
 
-<a name='1.3.3'></a>
-
-#### 1.3.3 基于 T4 GPU 的预测速度
-
-| Models            | Size | Latency(ms)<br>FP32<br>bs=1 | Latency(ms)<br>FP32<br>bs=4 | Latency(ms)<br>FP32<br>bs=8 |
-|-----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| MobileNetV3_small_x0_35     | 224     | 1.01                         | 1.44                         | 1.92                         |
-| MobileNetV3_small_x0_5      | 224     | 1.01                         | 1.49                         | 2.01                         |
-| MobileNetV3_small_x0_75     | 224     | 1.04                         | 1.71                         | 2.37                         |
-| MobileNetV3_small_x1_0      | 224     | 1.03                         | 1.76                         | 2.50                         |
-| MobileNetV3_small_x1_25     | 224     | 1.20                         | 2.04                         | 2.64                         |
-| MobileNetV3_large_x0_35     | 224     | 1.10                         | 1.74                         | 2.34                         |
-| MobileNetV3_large_x0_5      | 224     | 1.10                         | 1.85                         | 2.69                         |
-| MobileNetV3_large_x0_75     | 224     | 1.37                         | 2.23                         | 3.17                         |
-| MobileNetV3_large_x1_0      | 224     | 1.37                         | 2.67                         | 3.46                         |
-| MobileNetV3_large_x1_25     | 224     | 1.75                         | 2.87                         | 4.23                         |
-| MobileNetV3_small_x1_0_ssld | 224     | 1.06                         | 1.89                         | 2.48                         |
-| MobileNetV3_large_x1_0_ssld | 224     | 1.35                         | 2.47                         | 3.72                         |
-
-**备注：** 推理过程使用 TensorRT。
-
 <a name="2"></a>  
 
 ## 2. 模型快速体验
diff --git a/docs/zh_CN/models/ShuffleNetV2.md b/docs/zh_CN/models/ShuffleNetV2.md
index f111cb6307cadeaee2f82df7bfb0ee6cc09750ed..bb811e8618b56373325e8e8119f596d727633eb9 100644
--- a/docs/zh_CN/models/ShuffleNetV2.md
+++ b/docs/zh_CN/models/ShuffleNetV2.md
@@ -7,9 +7,8 @@
     - [1.1 模型简介](#1.1)
     - [1.2 模型指标](#1.2)
     - [1.3 Benchmark](#1.3)
-      - [1.3.1 基于 SD855 的预测速度](#1.3.1)
+      - [1.3.1 基于 SD855 的预测速度和存储大小](#1.3.1)
       - [1.3.2 基于 V100 GPU 的预测速度](#1.3.2)
-      - [1.3.3 基于 T4 GPU 的预测速度](#1.3.3)
 - [2. 模型快速体验](#2)
 - [3. 模型训练、评估和预测](#3)
 - [4. 模型推理部署](#4)
@@ -87,22 +86,6 @@ ShuffleNet 系列网络是旷视提出的轻量化网络结构，到目前为止
 
 **备注：** 精度类型为 FP32，推理过程使用 TensorRT。
 
-<a name='1.3.3'></a>
-
-#### 1.3.3 基于 T4 GPU 的预测速度
-
-| Models            | Size  | Latency(ms)<br>FP32<br>bs=1 | Latency(ms)<br>FP32<br>bs=4 | Latency(ms)<br>FP32<br>bs=8 |
-|-----------------------------|-----------------------|-----------------------|-----------------------|-----------------------|-----------------------|
-| ShuffleNetV2_swish          | 224    | 1.43                         | 1.93                         | 2.69                         |
-| ShuffleNetV2_x0_25          | 224    | 0.92                         | 1.27                         | 1.73                         |
-| ShuffleNetV2_x0_33          | 224    | 0.91                         | 1.29                         | 1.81                         |
-| ShuffleNetV2_x0_5           | 224    | 0.89                         | 1.43                         | 1.94                         |
-| ShuffleNetV2_x1_0           | 224    | 1.05                         | 1.76                         | 2.37                         |
-| ShuffleNetV2_x1_5           | 224    | 0.93                         | 1.99                         | 2.85                         |
-| ShuffleNetV2_x2_0           | 224    | 1.45                         | 2.70                         | 3.35                         |
-
-**备注：** 推理过程使用 TensorRT。
-
 <a name="2"></a>  
 
 ## 2. 模型快速体验