Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
MindSpore
docs
提交
33a5345b
D
docs
项目概览
MindSpore
/
docs
通知
4
Star
2
Fork
2
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
D
docs
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
33a5345b
编写于
8月 28, 2020
作者:
M
mindspore-ci-bot
提交者:
Gitee
8月 28, 2020
浏览文件
操作
浏览文件
下载
差异文件
!778 fix post training quant doc
Merge pull request !778 from xutianchun/quant_0.7
上级
eb859745
21c644b5
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
6 addition
and
6 deletion
+6
-6
lite/tutorials/source_zh_cn/use/post_training_quantization.md
.../tutorials/source_zh_cn/use/post_training_quantization.md
+6
-6
未找到文件。
lite/tutorials/source_zh_cn/use/post_training_quantization.md
浏览文件 @
33a5345b
...
@@ -32,9 +32,9 @@
...
@@ -32,9 +32,9 @@
| 参数名 | 属性 | 功能描述 | 参数类型 | 默认值 | 取值范围 |
| 参数名 | 属性 | 功能描述 | 参数类型 | 默认值 | 取值范围 |
| -------- | ------- | ----- | ----- | ----- | ----- |
| -------- | ------- | ----- | ----- | ----- | ----- |
| image_path | 必选 | 存放校准数据集的目录 | String | - | 该目录存放可直接用于执行推理的输入数据。由于目前框架还不支持数据预处理,所有数据必须事先完成所需的转换,使得它们满足推理的输入要求。 |
| image_path | 必选 | 存放校准数据集的目录 | String | - | 该目录存放可直接用于执行推理的输入数据。由于目前框架还不支持数据预处理,所有数据必须事先完成所需的转换,使得它们满足推理的输入要求。 |
| batch_count | 可选 | 使用的输入数目 | Integer | 100
0
| 大于0 |
| batch_count | 可选 | 使用的输入数目 | Integer | 100 | 大于0 |
| method_x | 可选 | 网络层输入输出数据量化算法 | String | KL | KL,MAX_MIN。 KL: 基于
[
KL散度
](
http://on-demand.gputechconf.com/gtc/2017/presentation/s7310-8-bit-inference-with-tensorrt.pdf
)
对数据范围作量化校准; MAX_MIN:基于最大值、最小值计算数据的量化参数。 在模型以及数据集比较较简单的情况下,推荐使用MAX_MIN |
| method_x | 可选 | 网络层输入输出数据量化算法 | String | KL | KL,MAX_MIN。 KL: 基于
[
KL散度
](
http://on-demand.gputechconf.com/gtc/2017/presentation/s7310-8-bit-inference-with-tensorrt.pdf
)
对数据范围作量化校准; MAX_MIN:基于最大值、最小值计算数据的量化参数。 在模型以及数据集比较较简单的情况下,推荐使用MAX_MIN |
| thread_num | 可选 | 使用校准数据集执行推理流程时的线程数 | Integer | 1 | 大于0 |
## 使用示例
## 使用示例
...
@@ -44,6 +44,7 @@
...
@@ -44,6 +44,7 @@
image_path=/dir/images
image_path=/dir/images
batch_count=100
batch_count=100
method_x=MAX_MIN
method_x=MAX_MIN
thread_num=1
```
```
校准数据集可以选择测试数据集的子集,要求
`/dir/images`
目录下存放的每个文件均是预处理好的输入数据,每个文件都可以直接用于推理的输入。
校准数据集可以选择测试数据集的子集,要求
`/dir/images`
目录下存放的每个文件均是预处理好的输入数据,每个文件都可以直接用于推理的输入。
3.
以TensorFlow Lite模型mnist.tflite为例,执行带训练后量化的模型转换命令:
3.
以TensorFlow Lite模型mnist.tflite为例,执行带训练后量化的模型转换命令:
...
@@ -56,8 +57,7 @@
...
@@ -56,8 +57,7 @@
| 模型 | 测试数据集 | method_x | FP32模型精度 | 训练后量化精度 | 说明 |
| 模型 | 测试数据集 | method_x | FP32模型精度 | 训练后量化精度 | 说明 |
| -------- | ------- | ----- | ----- | ----- | ----- |
| -------- | ------- | ----- | ----- | ----- | ----- |
| mnist.tflite |
[
MNIST
](
http://yann.lecun.com/exdb/mnist/
)
| MAX_MIN | 97.61% | 97.83% | 校准数据集选择MNIST Test数据集的前100张 |
|
[
Inception_V3
](
https://storage.googleapis.com/download.tensorflow.org/models/tflite/model_zoo/upload_20180427/inception_v3_2018_04_27.tgz
)
|
[
ImageNet
](
http://image-net.org/
)
| KL | 77.92% | 77.95% | 校准数据集随机选择ImageNet Validation数据集中的100张 |
| mobilenet_v1.tflite |
[
MNIST
](
http://yann.lecun.com/exdb/mnist/
)
| MAX_MIN | 98.36% | 98.40% | 校准数据集选择MNIST Test数据集的前100张 |
|
[
Mobilenet_V1_1.0_224
](
https://torage.googleapis.com/download.tensorflow.org/models/mobilenet_v1_2018_02_22/mobilenet_v1_1.0_224.tgz
)
|
[
ImageNet
](
http://image-net.org/
)
| KL | 70.96% | 70.69% | 校准数据集随机选择ImageNet Validation数据集中的100张 |
> 以上所有结果均在x86环境上测得。
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录