From a7d324c6761a46399c791fe6770fbe43b4e9eaaa Mon Sep 17 00:00:00 2001
From: heloowird <heloowird@gmail.com>
Date: Fri, 30 Jul 2021 22:26:50 +0800
Subject: [PATCH] Update 88.md

---
 docs/1.4/88.md | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/docs/1.4/88.md b/docs/1.4/88.md
index 69b82e38..50539a7c 100644
--- a/docs/1.4/88.md
+++ b/docs/1.4/88.md
@@ -4,7 +4,7 @@
 
 ## 量化导论
 
-量化是一种以低于浮点精度执行运算和存储张量的技术。 量化后的模型使用整数而不是浮点值执行部分或全部张量运算。 这允许更紧凑的模型表示，并在许多硬件平台上使用高性能矢量化操作。 与典型的 FP32 模型相比，PyTorch 支持 INT8 量化，从而可将模型大小减少为原来的，并将内存占用减少了 3 倍。 与 FP32 计算相比，在支持 INT8的硬件上计算通常快 2 到 4 倍。 量化主要是一种加速推理的技术，并且量化算子仅支持前向传递。
+量化是一种以低于浮点精度执行运算和存储张量的技术。 量化后的模型使用整数而不是浮点值执行部分或全部张量运算。 这允许更紧凑的模型表示，并在许多硬件平台上使用高性能矢量化操作。 与典型的 FP32 模型相比，PyTorch 支持 INT8 量化，从而可将模型大小减少为原来的 1/4，并将内存占用减少了 3 倍。 与 FP32 计算相比，在支持 INT8的硬件上计算通常快 2 到 4 倍。 量化主要是一种加速推理的技术，并且量化算子仅支持前向传递。
 
 PyTorch 支持多种方法来量化深度学习模型。 在大多数情况下，模型通常以 FP32 进行训练，然后被转换为 INT8。 此外，PyTorch 还支持量化感知训练，该训练使用伪量化模块对前向和后向传递中的量化误差进行建模。 注意，整个计算是以浮点数进行的。 在量化感知训练结束时，PyTorch 提供转换功能，将训练后的模型转换为较低的精度。
 
-- 
GitLab