Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleClas
提交
44a17b05
P
PaddleClas
项目概览
PaddlePaddle
/
PaddleClas
大约 1 年 前同步成功
通知
115
Star
4999
Fork
1114
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
19
列表
看板
标记
里程碑
合并请求
6
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleClas
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
19
Issue
19
列表
看板
标记
里程碑
合并请求
6
合并请求
6
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
44a17b05
编写于
6月 09, 2022
作者:
L
lvjian0706
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
add_multilingual_text_image_orientation
上级
1540eb34
变更
2
显示空白变更内容
内联
并排
Showing
2 changed file
with
19 addition
and
19 deletion
+19
-19
docs/zh_CN/PULC/PULC_language_classification.md
docs/zh_CN/PULC/PULC_language_classification.md
+12
-12
ppcls/configs/PULC/language_classification/MobileNetV3_small_x0_35.yaml
...PULC/language_classification/MobileNetV3_small_x0_35.yaml
+7
-7
未找到文件。
docs/zh_CN/PULC/PULC_language_classification.md
浏览文件 @
44a17b05
...
@@ -37,18 +37,18 @@
...
@@ -37,18 +37,18 @@
该案例提供了用户使用 PaddleClas 的超轻量图像分类方案(PULC,Practical Ultra Lightweight Classification)快速构建轻量级、高精度、可落地的语种分类模型。使用该方法训练得到的模型可以快速判断图片中的文字语种,该模型可以广泛应用于金融、政务等各种涉及多语种OCR处理的场景中。
该案例提供了用户使用 PaddleClas 的超轻量图像分类方案(PULC,Practical Ultra Lightweight Classification)快速构建轻量级、高精度、可落地的语种分类模型。使用该方法训练得到的模型可以快速判断图片中的文字语种,该模型可以广泛应用于金融、政务等各种涉及多语种OCR处理的场景中。
下表列出了语种分类模型的相关指标,前两行展现了使用 SwinTranformer_tiny 和 MobileNetV3_
large_x1_0
作为 backbone 训练得到的模型的相关指标,第三行至第六行依次展现了替换 backbone 为 PPLCNet_x1_0、使用 SSLD 预训练模型、使用 SSLD 预训练模型 + EDA 策略、使用 SSLD 预训练模型 + EDA 策略 + SKL-UGI 知识蒸馏策略训练得到的模型的相关指标。其中替换 backbone 为 PPLCNet_x1_0时,将数据预处理时的输入尺寸变为[192,48],且网络的下采样stride调整为[2, [2, 1], [2, 1], [2, 1], [2, 1]]。
下表列出了语种分类模型的相关指标,前两行展现了使用 SwinTranformer_tiny 和 MobileNetV3_
small_x0_35
作为 backbone 训练得到的模型的相关指标,第三行至第六行依次展现了替换 backbone 为 PPLCNet_x1_0、使用 SSLD 预训练模型、使用 SSLD 预训练模型 + EDA 策略、使用 SSLD 预训练模型 + EDA 策略 + SKL-UGI 知识蒸馏策略训练得到的模型的相关指标。其中替换 backbone 为 PPLCNet_x1_0时,将数据预处理时的输入尺寸变为[192,48],且网络的下采样stride调整为[2, [2, 1], [2, 1], [2, 1], [2, 1]]。
| 模型 | 精度 | 延时 | 存储 | 策略 |
| 模型 | 精度 | 延时 | 存储 | 策略 |
| ---------------------- | --------- | -------- | ------- | ---------------------------------------------- |
| ----------------------
-
| --------- | -------- | ------- | ---------------------------------------------- |
| SwinTranformer_tiny | 98.12 | 89.09 | 107 | 使用ImageNet预训练模型 |
| SwinTranformer_tiny | 98.12 | 89.09 | 107 | 使用ImageNet预训练模型 |
| MobileNetV3_
large_x1_0 | 98.3 | 4.7
8 | 17 | 使用ImageNet预训练模型 |
| MobileNetV3_
small_x0_35 | 95.92 | 2.9
8 | 17 | 使用ImageNet预训练模型 |
| PPLCNet_x1_0 | 98.35 | 2.58 | 6.5 | 使用ImageNet预训练模型 |
| PPLCNet_x1_0 | 98.35 | 2.58 | 6.5 | 使用ImageNet预训练模型 |
| PPLCNet_x1_0 | 98.7 | 2.58 | 6.5 | 使用SSLD预训练模型 |
| PPLCNet_x1_0 | 98.7 | 2.58 | 6.5 | 使用SSLD预训练模型 |
| PPLCNet_x1_0 | 99.12 | 2.58 | 6.5 | 使用SSLD预训练模型+EDA策略 |
| PPLCNet_x1_0 | 99.12 | 2.58 | 6.5 | 使用SSLD预训练模型+EDA策略 |
|
**PPLCNet_x1_0**
|
**99.26**
|
**2.58**
|
**6.5**
| 使用SSLD预训练模型+EDA策略+SKL-UGI知识蒸馏策略 |
|
**PPLCNet_x1_0**
|
**99.26**
|
**2.58**
|
**6.5**
| 使用SSLD预训练模型+EDA策略+SKL-UGI知识蒸馏策略 |
从表中可以看出,backbone 为 SwinTranformer_tiny 时精度比较高,但是推理速度较慢。将 backboone 替换为轻量级模型 MobileNetV3_
large_x1_0 后,精度和速度都有了提升。将 backbone 替换为 PPLCNet_x1_0 且调整预处理输入尺寸和网络的下采样stride时,精度较 MobileNetV3_large_x1_0 高0.05个百分点,同时速度提升 2 倍左右。在此基础上,使用 SSLD 预训练模型后,在不改变推理速度的前提下,精度可以提升 0.35 个百分点,进一步地,当融合EDA策略后,精度可以再提升 0.42 个百分点,最后,在使用 SKL-UGI 知识蒸馏后,精度可以继续提升 0.14 个百分点。此时,PPLCNet_x1_0 超过了 MobileNetV3_large_x1_0 和
SwinTranformer_tiny 模型的精度,并且速度有了明显提升。关于 PULC 的训练方法和推理部署方法将在下面详细介绍。
从表中可以看出,backbone 为 SwinTranformer_tiny 时精度比较高,但是推理速度较慢。将 backboone 替换为轻量级模型 MobileNetV3_
small_x0_35 后,速度提升明显,但精度有了大幅下降。将 backbone 替换为 PPLCNet_x1_0 且调整预处理输入尺寸和网络的下采样stride时,速度略为提升,同时精度较 MobileNetV3_large_x1_0 高2.43个百分点。在此基础上,使用 SSLD 预训练模型后,在不改变推理速度的前提下,精度可以提升 0.35 个百分点,进一步地,当融合EDA策略后,精度可以再提升 0.42 个百分点,最后,在使用 SKL-UGI 知识蒸馏后,精度可以继续提升 0.14 个百分点。此时,PPLCNet_x1_0 超过了
SwinTranformer_tiny 模型的精度,并且速度有了明显提升。关于 PULC 的训练方法和推理部署方法将在下面详细介绍。
**备注:**
关于PPLCNet的介绍可以参考
[
PPLCNet介绍
](
../models/PP-LCNet.md
)
,相关论文可以查阅
[
PPLCNet paper
](
https://arxiv.org/abs/2109.15099
)
。
**备注:**
关于PPLCNet的介绍可以参考
[
PPLCNet介绍
](
../models/PP-LCNet.md
)
,相关论文可以查阅
[
PPLCNet paper
](
https://arxiv.org/abs/2109.15099
)
。
...
...
ppcls/configs/PULC/language_classification/MobileNetV3_
large_x1_0
.yaml
→
ppcls/configs/PULC/language_classification/MobileNetV3_
small_x0_35
.yaml
浏览文件 @
44a17b05
...
@@ -13,10 +13,11 @@ Global:
...
@@ -13,10 +13,11 @@ Global:
# used for static mode and model export
# used for static mode and model export
image_shape
:
[
3
,
224
,
224
]
image_shape
:
[
3
,
224
,
224
]
save_inference_dir
:
./inference
save_inference_dir
:
./inference
start_eval_epoch
:
20
# model architecture
# model architecture
Arch
:
Arch
:
name
:
MobileNetV3_
large_x1_0
name
:
MobileNetV3_
small_x0_35
class_num
:
10
class_num
:
10
pretrained
:
True
pretrained
:
True
...
@@ -36,11 +37,11 @@ Optimizer:
...
@@ -36,11 +37,11 @@ Optimizer:
momentum
:
0.9
momentum
:
0.9
lr
:
lr
:
name
:
Cosine
name
:
Cosine
learning_rate
:
0.8
learning_rate
:
1.3
warmup_epoch
:
5
warmup_epoch
:
5
regularizer
:
regularizer
:
name
:
'
L2'
name
:
'
L2'
coeff
:
0.0000
2
coeff
:
0.0000
1
# data loader for train and eval
# data loader for train and eval
...
@@ -58,7 +59,6 @@ DataLoader:
...
@@ -58,7 +59,6 @@ DataLoader:
size
:
224
size
:
224
-
RandFlipImage
:
-
RandFlipImage
:
flip_code
:
1
flip_code
:
1
-
AutoAugment
:
-
NormalizeImage
:
-
NormalizeImage
:
scale
:
1.0/255.0
scale
:
1.0/255.0
mean
:
[
0.485
,
0.456
,
0.406
]
mean
:
[
0.485
,
0.456
,
0.406
]
...
@@ -71,7 +71,7 @@ DataLoader:
...
@@ -71,7 +71,7 @@ DataLoader:
drop_last
:
False
drop_last
:
False
shuffle
:
True
shuffle
:
True
loader
:
loader
:
num_workers
:
4
num_workers
:
8
use_shared_memory
:
True
use_shared_memory
:
True
Eval
:
Eval
:
...
@@ -98,11 +98,11 @@ DataLoader:
...
@@ -98,11 +98,11 @@ DataLoader:
drop_last
:
False
drop_last
:
False
shuffle
:
False
shuffle
:
False
loader
:
loader
:
num_workers
:
4
num_workers
:
8
use_shared_memory
:
True
use_shared_memory
:
True
Infer
:
Infer
:
infer_imgs
:
d
eploy/images/PULC/language_classification/word_35404.pn
g
infer_imgs
:
d
ocs/images/inference_deployment/whl_demo.jp
g
batch_size
:
10
batch_size
:
10
transforms
:
transforms
:
-
DecodeImage
:
-
DecodeImage
:
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录