Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleSlim
提交
cf4d540f
P
PaddleSlim
项目概览
PaddlePaddle
/
PaddleSlim
1 年多 前同步成功
通知
51
Star
1434
Fork
344
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
53
列表
看板
标记
里程碑
合并请求
16
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleSlim
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
53
Issue
53
列表
看板
标记
里程碑
合并请求
16
合并请求
16
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
未验证
提交
cf4d540f
编写于
5月 27, 2020
作者:
L
Liufang Sang
提交者:
GitHub
5月 27, 2020
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add mkldnn tutorial to index.rst (#310)
上级
c63a7aae
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
3 addition
and
2 deletion
+3
-2
demo/mkldnn_quant/quant_aware/PaddleCV_mkldnn_quantaware_tutorial_cn.md
...ant/quant_aware/PaddleCV_mkldnn_quantaware_tutorial_cn.md
+1
-1
docs/zh_cn/tutorials/image_classification_mkldnn_quant_aware_tutorial.md
...rials/image_classification_mkldnn_quant_aware_tutorial.md
+1
-1
docs/zh_cn/tutorials/index.rst
docs/zh_cn/tutorials/index.rst
+1
-0
未找到文件。
demo/mkldnn_quant/quant_aware/PaddleCV_mkldnn_quantaware_tutorial_cn.md
浏览文件 @
cf4d540f
...
...
@@ -34,7 +34,7 @@ import numpy as np
#### 2.1 量化训练
量化训练流程可以参考
[
分类模型的
离线量化
流程
](
https://paddlepaddle.github.io/PaddleSlim/tutorials/quant_aware_demo/
)
量化训练流程可以参考
[
分类模型的
量化训练
流程
](
https://paddlepaddle.github.io/PaddleSlim/tutorials/quant_aware_demo/
)
**注意量化训练过程中config参数:**
-
**quantize_op_types:**
目前CPU上支持量化
`depthwise_conv2d`
,
`mul`
,
`conv2d`
,
`matmul`
,
`transpose2`
,
`reshape2`
,
`pool2d`
,
`scale`
。但是训练阶段插入fake quantize/dequantize op时,只需在前四种op前后插入fake quantize/dequantize ops,因为后面四种op
`matmul`
,
`transpose2`
,
`reshape2`
,
`pool2d`
的输入输出scale不变,将从前后方op的输入输出scales获得scales,所以
`quantize_op_types`
参数只需要
`depthwise_conv2d`
,
`mul`
,
`conv2d`
,
`matmul`
即可。
...
...
docs/zh_cn/tutorials/image_classification_mkldnn_quant_aware_tutorial.md
浏览文件 @
cf4d540f
# CPU部署预测INT8模型
的精度和性能
# CPU部署预测INT8模型
在Intel(R) Xeon(R) Gold 6271机器上,经过量化和DNNL加速,INT8模型在单线程上性能为原FP32模型的3~4倍;在 Intel(R) Xeon(R) Gold 6148,单线程性能为原FP32模型的1.5倍,而精度仅有极小下降。图像分类量化的样例教程请参考
[
图像分类INT8模型在CPU优化部署和预测
](
https://github.com/PaddlePaddle/PaddleSlim/tree/develop/demo/mkldnn_quant/quant_aware/PaddleCV_mkldnn_quantaware_tutorial_cn.md
)
。自然语言处理模型的量化请参考
[
ERNIE INT8 模型精度与性能复现
](
https://github.com/PaddlePaddle/benchmark/tree/master/Inference/c%2B%2B/ernie/mkldnn
)
...
...
docs/zh_cn/tutorials/index.rst
浏览文件 @
cf4d540f
...
...
@@ -6,6 +6,7 @@
:maxdepth: 1
image_classification_sensitivity_analysis_tutorial.md
image_classification_mkldnn_quant_aware_tutorial.md
darts_nas_turorial.md
paddledetection_slim_distillation_tutorial.md
paddledetection_slim_nas_tutorial.md
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录