README.md 1.3 KB
Newer Older
1 2
<div align="center">
  <h3>
3 4
    <a href="./README.md">
      模型量化概述
5 6
    </a>
    <span> | </span>
7 8
    <a href="../docs/tutorial.md">
      模型量化原理
9 10
    </a>
    <span> | </span>
11 12
    <a href="./quantization_aware_training.md">
      量化训练使用方法和示例
13 14
    </a>
    <span> | </span>
15 16
    <a href="./post_training_quantization.md">
      训练后量化使用方法和示例
17 18 19 20 21
    </a>
  </h3>
</div>

---
22
模型量化是使用更少的比特数表示神经网络的权重和激活的方法,具有加快推理速度、减小存储大小、降低功耗等优点。
23

24
目前,模型量化主要分为量化训练(Quantization Aware Training)和训练后量化(Post Training Quantization)。量化训练是在训练过程中对量化进行建模以确定量化参数,具有为复杂模型提供更高的精度的优点。训练后量化是基于采样数据,采用KL散度等方法计算量化比例因子的方法。它具有无需重新训练、快速获得量化模型的方法。
25

26 27 28 29
模型量化的原理和Low-Level API使用方法可以参考如下文档:
* [模型量化原理](../docs/tutorial.md)
* [量化训练Low-Level API使用方法和示例](./quantization_aware_training.md)
* [训练后量化Low-Level API使用方法和示例](./post_training_quantization.md)