提交 21c644b5 编写于 作者: X xutianchun

fix post quantizaition doc

上级 dd336c04
......@@ -32,9 +32,9 @@
| 参数名 | 属性 | 功能描述 | 参数类型 | 默认值 | 取值范围 |
| -------- | ------- | ----- | ----- | ----- | ----- |
| image_path | 必选 | 存放校准数据集的目录 | String | - | 该目录存放可直接用于执行推理的输入数据。由于目前框架还不支持数据预处理,所有数据必须事先完成所需的转换,使得它们满足推理的输入要求。 |
| batch_count | 可选 | 使用的输入数目 | Integer | 1000 | 大于0 |
| batch_count | 可选 | 使用的输入数目 | Integer | 100 | 大于0 |
| method_x | 可选 | 网络层输入输出数据量化算法 | String | KL | KL,MAX_MIN。 KL: 基于[KL散度](http://on-demand.gputechconf.com/gtc/2017/presentation/s7310-8-bit-inference-with-tensorrt.pdf)对数据范围作量化校准; MAX_MIN:基于最大值、最小值计算数据的量化参数。 在模型以及数据集比较较简单的情况下,推荐使用MAX_MIN |
| thread_num | 可选 | 使用校准数据集执行推理流程时的线程数 | Integer | 1 | 大于0 |
## 使用示例
......@@ -44,6 +44,7 @@
image_path=/dir/images
batch_count=100
method_x=MAX_MIN
thread_num=1
```
校准数据集可以选择测试数据集的子集,要求`/dir/images`目录下存放的每个文件均是预处理好的输入数据,每个文件都可以直接用于推理的输入。
3. 以TensorFlow Lite模型mnist.tflite为例,执行带训练后量化的模型转换命令:
......@@ -56,8 +57,7 @@
| 模型 | 测试数据集 | method_x | FP32模型精度 | 训练后量化精度 | 说明 |
| -------- | ------- | ----- | ----- | ----- | ----- |
| mnist.tflite | [MNIST](http://yann.lecun.com/exdb/mnist/) | MAX_MIN | 97.61% | 97.83% | 校准数据集选择MNIST Test数据集的前100张 |
| mobilenet_v1.tflite | [MNIST](http://yann.lecun.com/exdb/mnist/) | MAX_MIN | 98.36% | 98.40% | 校准数据集选择MNIST Test数据集的前100张 |
| [Inception_V3](https://storage.googleapis.com/download.tensorflow.org/models/tflite/model_zoo/upload_20180427/inception_v3_2018_04_27.tgz) | [ImageNet](http://image-net.org/) | KL | 77.92% | 77.95% | 校准数据集随机选择ImageNet Validation数据集中的100张 |
| [Mobilenet_V1_1.0_224](https://torage.googleapis.com/download.tensorflow.org/models/mobilenet_v1_2018_02_22/mobilenet_v1_1.0_224.tgz) | [ImageNet](http://image-net.org/) | KL | 70.96% | 70.69% | 校准数据集随机选择ImageNet Validation数据集中的100张 |
> 以上所有结果均在x86环境上测得。
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册