Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
b91055ee
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
b91055ee
编写于
12月 15, 2020
作者:
W
weishengyu
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
rename style_text_rec -> style_text
上级
703bb1a9
变更
40
显示空白变更内容
内联
并排
Showing
40 changed file
with
23 addition
and
21 deletion
+23
-21
StyleText/README.md
StyleText/README.md
+0
-0
StyleText/README_ch.md
StyleText/README_ch.md
+23
-21
StyleText/__init__.py
StyleText/__init__.py
+0
-0
StyleText/arch/__init__.py
StyleText/arch/__init__.py
+0
-0
StyleText/arch/base_module.py
StyleText/arch/base_module.py
+0
-0
StyleText/arch/decoder.py
StyleText/arch/decoder.py
+0
-0
StyleText/arch/encoder.py
StyleText/arch/encoder.py
+0
-0
StyleText/arch/spectral_norm.py
StyleText/arch/spectral_norm.py
+0
-0
StyleText/arch/style_text_rec.py
StyleText/arch/style_text_rec.py
+0
-0
StyleText/configs/config.yml
StyleText/configs/config.yml
+0
-0
StyleText/configs/dataset_config.yml
StyleText/configs/dataset_config.yml
+0
-0
StyleText/doc/images/1.png
StyleText/doc/images/1.png
+0
-0
StyleText/doc/images/2.png
StyleText/doc/images/2.png
+0
-0
StyleText/doc/images/3.png
StyleText/doc/images/3.png
+0
-0
StyleText/doc/images/4.jpg
StyleText/doc/images/4.jpg
+0
-0
StyleText/doc/images/5.png
StyleText/doc/images/5.png
+0
-0
StyleText/doc/images/6.png
StyleText/doc/images/6.png
+0
-0
StyleText/engine/__init__.py
StyleText/engine/__init__.py
+0
-0
StyleText/engine/corpus_generators.py
StyleText/engine/corpus_generators.py
+0
-0
StyleText/engine/predictors.py
StyleText/engine/predictors.py
+0
-0
StyleText/engine/style_samplers.py
StyleText/engine/style_samplers.py
+0
-0
StyleText/engine/synthesisers.py
StyleText/engine/synthesisers.py
+0
-0
StyleText/engine/text_drawers.py
StyleText/engine/text_drawers.py
+0
-0
StyleText/engine/writers.py
StyleText/engine/writers.py
+0
-0
StyleText/examples/corpus/example.txt
StyleText/examples/corpus/example.txt
+0
-0
StyleText/examples/image_list.txt
StyleText/examples/image_list.txt
+0
-0
StyleText/examples/style_images/1.jpg
StyleText/examples/style_images/1.jpg
+0
-0
StyleText/examples/style_images/2.jpg
StyleText/examples/style_images/2.jpg
+0
-0
StyleText/fonts/ch_standard.ttf
StyleText/fonts/ch_standard.ttf
+0
-0
StyleText/fonts/en_standard.ttf
StyleText/fonts/en_standard.ttf
+0
-0
StyleText/fonts/ko_standard.ttf
StyleText/fonts/ko_standard.ttf
+0
-0
StyleText/tools/__init__.py
StyleText/tools/__init__.py
+0
-0
StyleText/tools/synth_dataset.py
StyleText/tools/synth_dataset.py
+0
-0
StyleText/tools/synth_image.py
StyleText/tools/synth_image.py
+0
-0
StyleText/utils/__init__.py
StyleText/utils/__init__.py
+0
-0
StyleText/utils/config.py
StyleText/utils/config.py
+0
-0
StyleText/utils/load_params.py
StyleText/utils/load_params.py
+0
-0
StyleText/utils/logging.py
StyleText/utils/logging.py
+0
-0
StyleText/utils/math_functions.py
StyleText/utils/math_functions.py
+0
-0
StyleText/utils/sys_funcs.py
StyleText/utils/sys_funcs.py
+0
-0
未找到文件。
StyleText
Rec
/README.md
→
StyleText/README.md
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/README_ch.md
→
StyleText/README_ch.md
浏览文件 @
b91055ee
## Style Text
Rec
## Style Text
### 目录
-
[
工具简介
](
#工具简介
)
-
[
环境配置
](
#环境配置
)
-
[
快速上手
](
#快速上手
)
-
[
高级使用
](
#高级使用
)
-
[
应用示例
](
#应用示例
)
-
[
一、工具简介
](
#
一、工具简介)
-
[
二、环境配置
](
#
二、环境配置)
-
[
三、快速上手
](
#
三、快速上手)
-
[
四、应用示例
](
#
四、应用示例)
### 工具简介
###
一、
工具简介
<div
align=
"center"
>
<img
src=
"doc/images/3.png"
width=
"800"
>
</div>
...
...
@@ -23,13 +22,13 @@ Style-Text数据合成工具是基于百度自研的文本编辑算法《Editing
<img
src=
"doc/images/2.png"
width=
"1000"
>
</div>
### 环境配置
###
二、
环境配置
1.
参考
[
快速安装
](
../doc/doc_ch/installation.md
)
,安装PaddleOCR。
2.
进入
`
style_text_rec
`
目录,下载模型,并解压:
2.
进入
`
StyleText
`
目录,下载模型,并解压:
```
bash
cd
style_text_rec
cd
StyleText
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/style_text_models.zip
unzip style_text_models.zip
```
...
...
@@ -47,7 +46,9 @@ fusion_generator:
pretrain: style_text_models/fusion_generator
```
### 快速上手
### 三、快速上手
#### 合成单张图
1.
运行tools/synth_image,生成示例图片:
...
...
@@ -55,7 +56,7 @@ fusion_generator:
python3
-
m
tools
.
synth_image
-
c
configs
/
config
.
yml
```
1
.
运行后,会生成
`fake_busion.jpg`
,即为最终结果。
2
.
运行后,会生成
`fake_busion.jpg`
,即为最终结果。
<div
align=
"center"
>
<img
src=
"doc/images/4.jpg"
width=
"300"
>
</div>
...
...
@@ -63,17 +64,17 @@ python3 -m tools.synth_image -c configs/config.yml
*
`fake_bg.jpg`
:为风格参考图去掉文字后的背景;
*
`fake_text.jpg`
:是用提供的字符串,仿照风格参考图中文字的风格,生成在灰色背景上的文字图片。
2
.
如果您想尝试其他风格图像和文字的效果,可以添加style_image,text_corpus和language参数:
3
.
如果您想尝试其他风格图像和文字的效果,可以添加style_image,text_corpus和language参数:
```
python
python3
-
m
tools
.
synth_image
-
c
configs
/
config
.
yml
--
style_image
examples
/
style_images
/
2.j
pg
--
text_corpus
PaddleOCR
--
language
en
```
*
注意:语言选项和语料相对应,目前我们支持英文、简体中文和韩语。
3
.
在
`tools/synth_image.py`
中,我们还提供了一个
`batch_synth_images`
方法,可以两两组合语料和图片,批量生成一批数据。
4
.
在
`tools/synth_image.py`
中,我们还提供了一个
`batch_synth_images`
方法,可以两两组合语料和图片,批量生成一批数据。
###
高级使用
###
# 批量合成
在开始合成数据
集
前,需要准备一些素材。
在开始合成数据前,需要准备一些素材。
首先,需要风格图片作为合成图片的参考依据,这些数据可以是用作训练OCR识别模型的数据集。本例中使用带有标注文件的数据集作为风格图片.
...
...
@@ -88,7 +89,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
*
`language`
:语料的语种;
*
`corpus_file`
: 语料文件路径。
我们提供了一批
[
样例图
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/chkoen_5w.tar
)
供您试用
,下面给出了一些示例:
我们提供了一批
中英韩5w通用数据供您试用 (
[
下载地址
](
https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/chkoen_5w.tar
)
)
,下面给出了一些示例:
<div
align=
"center"
>
<img
src=
"doc/images/5.png"
width=
"800"
>
</div>
...
...
@@ -106,21 +107,22 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
```
### 应用示例
###
四、
应用示例
在完成上述操作后,即可得到用于OCR识别的合成数据集,下面给出了一些数据集生成的示例:
在完成上述操作后,即可得到用于OCR识别的合成数据集。在实用场景中,我们经常遇到数据量不足的情况,这时可以使用已有数据作为style_input,合成数据。
下面给出了一些数据集生成的示例:
<div
align=
"center"
>
<img
src=
"doc/images/6.png"
width=
"800"
>
</div>
请您参考
[
OCR识别文档
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md#%E5%90%AF%E5%8A%A8%E8%AE%AD%E7%BB%83
)
,完成训练。
下面展示了一些使用合成数据训练的效果
:
在添加这些合成数据进行训练后,识别模型的效果得到了显著提升,如下表所示
:
| 场景 | 字符 | 原始数据 | 测试数据 | 只使用原始数据的识别准确率 | 新增合成数据 | 使用合成数据识别准确率 | 指标提升 |
| -------- | ---------- | -------- | -------- | -------------------------- | ------------ | ---------------------- | -------- |
| 金属表面 | 英文和数字 | 2203 | 650 | 0.5938 | 20000 | 0.7546 | 16% |
| 随机背景 | 韩语 | 5631 | 1230 | 0.3012 | 100000 | 0.5057 | 20% |
识别模型的训练方法您可以参考
[
OCR识别文档
](
../doc/doc_ch/recognition.md
)
### 项目结构
```
style_text_rec
...
...
StyleText
Rec
/__init__.py
→
StyleText/__init__.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/arch/__init__.py
→
StyleText/arch/__init__.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/arch/base_module.py
→
StyleText/arch/base_module.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/arch/decoder.py
→
StyleText/arch/decoder.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/arch/encoder.py
→
StyleText/arch/encoder.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/arch/spectral_norm.py
→
StyleText/arch/spectral_norm.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/arch/style_text_rec.py
→
StyleText/arch/style_text_rec.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/configs/config.yml
→
StyleText/configs/config.yml
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/configs/dataset_config.yml
→
StyleText/configs/dataset_config.yml
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/doc/images/1.png
→
StyleText/doc/images/1.png
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/doc/images/2.png
→
StyleText/doc/images/2.png
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/doc/images/3.png
→
StyleText/doc/images/3.png
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/doc/images/4.jpg
→
StyleText/doc/images/4.jpg
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/doc/images/5.png
→
StyleText/doc/images/5.png
查看替换文件 @
703bb1a9
浏览文件 @
b91055ee
122.5 KB
|
W:
|
H:
118.0 KB
|
W:
|
H:
2-up
Swipe
Onion skin
StyleText
Rec
/doc/images/6.png
→
StyleText/doc/images/6.png
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/engine/__init__.py
→
StyleText/engine/__init__.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/engine/corpus_generators.py
→
StyleText/engine/corpus_generators.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/engine/predictors.py
→
StyleText/engine/predictors.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/engine/style_samplers.py
→
StyleText/engine/style_samplers.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/engine/synthesisers.py
→
StyleText/engine/synthesisers.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/engine/text_drawers.py
→
StyleText/engine/text_drawers.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/engine/writers.py
→
StyleText/engine/writers.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/examples/corpus/example.txt
→
StyleText/examples/corpus/example.txt
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/examples/image_list.txt
→
StyleText/examples/image_list.txt
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/examples/style_images/1.jpg
→
StyleText/examples/style_images/1.jpg
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/examples/style_images/2.jpg
→
StyleText/examples/style_images/2.jpg
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/fonts/ch_standard.ttf
→
StyleText/fonts/ch_standard.ttf
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/fonts/en_standard.ttf
→
StyleText/fonts/en_standard.ttf
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/fonts/ko_standard.ttf
→
StyleText/fonts/ko_standard.ttf
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/tools/__init__.py
→
StyleText/tools/__init__.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/tools/synth_dataset.py
→
StyleText/tools/synth_dataset.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/tools/synth_image.py
→
StyleText/tools/synth_image.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/utils/__init__.py
→
StyleText/utils/__init__.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/utils/config.py
→
StyleText/utils/config.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/utils/load_params.py
→
StyleText/utils/load_params.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/utils/logging.py
→
StyleText/utils/logging.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/utils/math_functions.py
→
StyleText/utils/math_functions.py
浏览文件 @
b91055ee
文件已移动
StyleText
Rec
/utils/sys_funcs.py
→
StyleText/utils/sys_funcs.py
浏览文件 @
b91055ee
文件已移动
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录