Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleX
提交
965ed41d
P
PaddleX
项目概览
PaddlePaddle
/
PaddleX
通知
138
Star
4
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
43
列表
看板
标记
里程碑
合并请求
5
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleX
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
43
Issue
43
列表
看板
标记
里程碑
合并请求
5
合并请求
5
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
965ed41d
编写于
7月 11, 2020
作者:
C
Channingss
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
update lite&sdk doc
上级
d4811e2b
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
3 addition
and
2 deletion
+3
-2
docs/deploy/paddlelite/slim/compress.md
docs/deploy/paddlelite/slim/compress.md
+3
-2
未找到文件。
docs/deploy/paddlelite/slim/compress.md
浏览文件 @
965ed41d
...
@@ -2,11 +2,12 @@
...
@@ -2,11 +2,12 @@
为了更好地满足端侧部署场景下,低内存带宽、低功耗、低计算资源占用以及低模型存储等需求,PaddleX通过集成PaddleSlim实现模型量化和裁剪,可提升PaddleLite端侧部署性能。
为了更好地满足端侧部署场景下,低内存带宽、低功耗、低计算资源占用以及低模型存储等需求,PaddleX通过集成PaddleSlim实现模型量化和裁剪,可提升PaddleLite端侧部署性能。
## 模型量化
## 模型量化
### 原理介绍
### 原理介绍
定点量化使用更少的比特数(如8-bit、3-bit、2-bit等)表示神经网络的权重和激活值,从而加速模型推理速度。PaddleX提供了训练后量化技术,其原理可参见
[
训练后量化原理
](
https://paddlepaddle.github.io/PaddleSlim/algo/algo.html#id14
)
,该量化使用KL散度确定量化比例因子,将FP32模型转成INT8模型,且不需要重新训练,可以快速得到量化模型。
定点量化使用更少的比特数(如8-bit、3-bit、2-bit等)表示神经网络的权重和激活值,从而加速模型推理速度。PaddleX提供了训练后量化技术,其原理可参见
[
训练后量化原理
](
https://paddlepaddle.github.io/PaddleSlim/algo/algo.html#id14
)
,该量化使用KL散度确定量化比例因子,将FP32模型转成INT8模型,且不需要重新训练,可以快速得到量化模型。
### 使用PaddleX量化模型
### 使用PaddleX量化模型
PaddleX提供了
`export_quant_model`
接口,让用户以接口的形式完成模型以post_quantization方式量化并导出。点击查看
[
量化接口使用文档
](
../../apis/slim.
md
)
。
PaddleX提供了
`export_quant_model`
接口,让用户以接口的形式完成模型以post_quantization方式量化并导出。点击查看
[
量化接口使用文档
](
../../apis/slim.
html
)
。
### 量化性能对比
### 量化性能对比
模型量化后的性能对比指标请查阅
[
PaddleSlim模型库
](
https://paddlepaddle.github.io/PaddleSlim/model_zoo.html
)
模型量化后的性能对比指标请查阅
[
PaddleSlim模型库
](
https://paddlepaddle.github.io/PaddleSlim/model_zoo.html
)
...
@@ -35,7 +36,7 @@ PaddleX提供了两种方式:
...
@@ -35,7 +36,7 @@ PaddleX提供了两种方式:
> 注:各模型内置的裁剪方案分别依据的数据集为: 图像分类——ImageNet数据集、目标检测——PascalVOC数据集、语义分割——CityScape数据集
> 注:各模型内置的裁剪方案分别依据的数据集为: 图像分类——ImageNet数据集、目标检测——PascalVOC数据集、语义分割——CityScape数据集
### 裁剪实验
### 裁剪实验
基于上述两种方案,我们在PaddleX上使用样例数据进行了实验,在Tesla P40上实验指标如下所示,使用方法见
[
使用教程-模型压缩
](
../../../../tutorials/compress/README.
md
)
基于上述两种方案,我们在PaddleX上使用样例数据进行了实验,在Tesla P40上实验指标如下所示,使用方法见
[
使用教程-模型压缩
](
../../../../tutorials/compress/README.
html
)
#### 图像分类
#### 图像分类
实验背景:使用MobileNetV2模型,数据集为蔬菜分类示例数据
实验背景:使用MobileNetV2模型,数据集为蔬菜分类示例数据
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录