Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
1c5e7f25
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
1c5e7f25
编写于
6月 24, 2022
作者:
T
Topdu
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
aug p infe
上级
773b687f
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
23 addition
and
17 deletion
+23
-17
applications/高精度中文识别模型.md
applications/高精度中文识别模型.md
+6
-5
configs/rec/rec_svtrnet_ch.yml
configs/rec/rec_svtrnet_ch.yml
+4
-4
ppocr/data/imaug/rec_img_aug.py
ppocr/data/imaug/rec_img_aug.py
+13
-8
未找到文件。
applications/高精度中文识别模型.md
浏览文件 @
1c5e7f25
...
...
@@ -2,7 +2,7 @@
## 1. 简介
PP-OCRv3是百度开源的超轻量级场景文本检测识别模型库,其中超轻量的场景中文识别模型SVTR_LCNet使用了SVTR算法结构。为了保证速度,SVTR_LCNet将SVTR模型的Local Blocks替换为LCNet,使用两层Global Blocks。在中文场景中,
经过多次优化,SVTR_LCNet的最终精度为79.4%。具体的
:
PP-OCRv3是百度开源的超轻量级场景文本检测识别模型库,其中超轻量的场景中文识别模型SVTR_LCNet使用了SVTR算法结构。为了保证速度,SVTR_LCNet将SVTR模型的Local Blocks替换为LCNet,使用两层Global Blocks。在中文场景中,
PP-OCRv3识别主要使用如下优化策略
:
-
GTC:Attention指导CTC训练策略;
-
TextConAug:挖掘文字上下文信息的数据增广策略;
-
TextRotNet:自监督的预训练模型;
...
...
@@ -11,10 +11,11 @@ PP-OCRv3是百度开源的超轻量级场景文本检测识别模型库,其中
其中
*UIM:无标注数据挖掘方案*
使用了高精度的SVTR中文模型进行无标注文件的刷库,该模型在PP-OCRv3识别的数据集上训练,精度对比如下表。
|中文识别算法|模型|精度|
| --- | --- | --- |
|PP-OCRv3|SVTR_LCNet|79.4%|
|SVTR|SVTR-Tiny|82.5%|
|中文识别算法|模型|UIM|精度|
| --- | --- | --- |--- |
|PP-OCRv3|SVTR_LCNet| w/o |78.4%|
|PP-OCRv3|SVTR_LCNet| w |79.4%|
|SVTR|SVTR-Tiny|-|82.5%|
aistudio项目链接:
[
高精度中文场景文本识别模型SVTR
](
https://aistudio.baidu.com/aistudio/projectdetail/4263032
)
...
...
configs/rec/rec_svtrnet_ch.yml
浏览文件 @
1c5e7f25
...
...
@@ -92,9 +92,9 @@ Metric:
Train
:
dataset
:
name
:
SimpleDataSet
data_dir
:
./train_data
label_file_list
:
-
/paddle/data/ocr_all/train_all_list.txt
data_dir
:
/paddle/data/ocr_all
-
./train_data/train_list.txt
ext_op_transform_idx
:
1
transforms
:
-
DecodeImage
:
...
...
@@ -130,9 +130,9 @@ Train:
Eval
:
dataset
:
name
:
SimpleDataSet
data_dir
:
/paddle/data/ocr_all
data_dir
:
./train_data
label_file_list
:
-
/paddle/data/ocr_all
/val_list.txt
-
./train_data
/val_list.txt
transforms
:
-
DecodeImage
:
img_mode
:
BGR
...
...
ppocr/data/imaug/rec_img_aug.py
浏览文件 @
1c5e7f25
...
...
@@ -97,7 +97,11 @@ class BaseDataAugmentation(object):
class
ABINetRecAug
(
object
):
def
__init__
(
self
,
**
kwargs
):
def
__init__
(
self
,
geometry_p
=
0.5
,
deterioration_p
=
0.25
,
colorjitter_p
=
0.25
,
**
kwargs
):
self
.
transforms
=
Compose
([
CVGeometry
(
degrees
=
45
,
...
...
@@ -105,13 +109,14 @@ class ABINetRecAug(object):
scale
=
(
0.5
,
2.
),
shear
=
(
45
,
15
),
distortion
=
0.5
,
p
=
0.5
),
CVDeterioration
(
var
=
20
,
degrees
=
6
,
factor
=
4
,
p
=
0.25
),
CVColorJitter
(
brightness
=
0.5
,
contrast
=
0.5
,
saturation
=
0.5
,
hue
=
0.1
,
p
=
0.25
)
p
=
geometry_p
),
CVDeterioration
(
var
=
20
,
degrees
=
6
,
factor
=
4
,
p
=
deterioration_p
),
CVColorJitter
(
brightness
=
0.5
,
contrast
=
0.5
,
saturation
=
0.5
,
hue
=
0.1
,
p
=
colorjitter_p
)
])
def
__call__
(
self
,
data
):
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录