Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
PaddlePaddle
PaddleOCR
提交
f03dcd60
P
PaddleOCR
项目概览
PaddlePaddle
/
PaddleOCR
大约 1 年 前同步成功
通知
1528
Star
32962
Fork
6643
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
108
列表
看板
标记
里程碑
合并请求
7
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
108
Issue
108
列表
看板
标记
里程碑
合并请求
7
合并请求
7
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
f03dcd60
编写于
12月 15, 2020
作者:
W
weishengyu
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
dbg
上级
8bce9baa
变更
3
隐藏空白更改
内联
并排
Showing
3 changed file
with
22 addition
and
31 deletion
+22
-31
doc/doc_ch/style_text_rec.md
doc/doc_ch/style_text_rec.md
+16
-11
style_text_rec/tools/synth_image.py
style_text_rec/tools/synth_image.py
+0
-20
style_text_rec/utils/config.py
style_text_rec/utils/config.py
+6
-0
未找到文件。
doc/doc_ch/style_text_rec.md
浏览文件 @
f03dcd60
## Style Text Rec
## Style Text Rec
### 目录
### 目录
[
工具简介
](
#工具简介
)
[TOC]
[
环境配置
](
#环境配置
)
[
快速上手
](
#快速上手
)
[
高级使用
](
#高级使用
)
[
应用示例
](
#应用示例
)
### 工具简介
### 工具简介
<div
align=
"center"
>
<div
align=
"center"
>
...
@@ -25,7 +28,7 @@ Style-Text是对百度自研文本编辑算法《Editing Text in the Wild》中
...
@@ -25,7 +28,7 @@ Style-Text是对百度自研文本编辑算法《Editing Text in the Wild》中
```
bash
```
bash
cd
style_text_rec
cd
style_text_rec
wget
/
https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/style_text_models.zip
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/style_text_models.zip
unzip style_text_models.zip
unzip style_text_models.zip
```
```
...
@@ -52,15 +55,16 @@ python3 -m tools.synth_image -c configs/config.yml
...
@@ -52,15 +55,16 @@ python3 -m tools.synth_image -c configs/config.yml
1.
运行后,会生成
`fake_busion.jpg`
,即为最终结果。
1.
运行后,会生成
`fake_busion.jpg`
,即为最终结果。
<div
align=
"center"
>
<div
align=
"center"
>
<img
src=
"../imgs_style_text/4.jpg"
width=
"
8
00"
>
<img
src=
"../imgs_style_text/4.jpg"
width=
"
3
00"
>
</div>
</div>
除此之外,程序还会生成并保存中间结果:
除此之外,程序还会生成并保存中间结果:
*
`fake_bg.jpg`
:为风格参考图去掉文字后的背景;
*
`fake_bg.jpg`
:为风格参考图去掉文字后的背景;
*
`fake_text.jpg`
:是用提供的字符串,仿照风格参考图中文字的风格,生成在灰色背景上的文字图片。
*
`fake_text.jpg`
:是用提供的字符串,仿照风格参考图中文字的风格,生成在灰色背景上的文字图片。
2.
如果您想尝试其他风格图像和文字的效果,可以在
`tools/synth_image.py`
中修改:
2.
如果您想尝试其他风格图像和文字的效果,可以添加style_image和text_corpus参数:
*
`img = cv2.imread("examples/style_images/1.jpg")`
:请在此处修改风格图像的目录;
```
python
*
`corpus = "PaddleOCR"`
:请在此处修改要使用的语料文本
python3
-
m
tools
.
synth_image
-
c
configs
/
config
.
yml
--
style_image
examples
/
style_images
/
2.j
pg
--
text_corpus
PaddleOCR
```
*
注意:请修改语言选项(
`language = "en"`
)和语料相对应,目前我们支持英文、简体中文和韩语。
*
注意:请修改语言选项(
`language = "en"`
)和语料相对应,目前我们支持英文、简体中文和韩语。
3.
在
`tools/synth_image.py`
中,我们还提供了一个
`batch_synth_images`
方法,可以两两组合语料和图片,批量生成一批数据。
3.
在
`tools/synth_image.py`
中,我们还提供了一个
`batch_synth_images`
方法,可以两两组合语料和图片,批量生成一批数据。
...
@@ -102,8 +106,8 @@ python3 -m tools.synth_image -c configs/config.yml
...
@@ -102,8 +106,8 @@ python3 -m tools.synth_image -c configs/config.yml
在完成上述操作后,即可得到用于OCR识别的合成数据集,接下来请参考
[
OCR识别文档
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md#%E5%90%AF%E5%8A%A8%E8%AE%AD%E7%BB%83
)
,完成训练。
在完成上述操作后,即可得到用于OCR识别的合成数据集,接下来请参考
[
OCR识别文档
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md#%E5%90%AF%E5%8A%A8%E8%AE%AD%E7%BB%83
)
,完成训练。
### 项目结构
### 项目结构
```
.
style_text_rec
|-- arch
|-- arch
| |-- base_module.py
| |-- base_module.py
| |-- decoder.py
| |-- decoder.py
...
@@ -140,4 +144,5 @@ python3 -m tools.synth_image -c configs/config.yml
...
@@ -140,4 +144,5 @@ python3 -m tools.synth_image -c configs/config.yml
|-- load_params.py
|-- load_params.py
|-- logging.py
|-- logging.py
|-- math_functions.py
|-- math_functions.py
`
-- sys_funcs.py
`-- sys_funcs.py
\ No newline at end of file
```
\ No newline at end of file
style_text_rec/tools/synth_image.py
浏览文件 @
f03dcd60
...
@@ -77,26 +77,6 @@ def batch_synth_images():
...
@@ -77,26 +77,6 @@ def batch_synth_images():
print
(
cno
,
corpus_num
,
sno
,
style_img_num
)
print
(
cno
,
corpus_num
,
sno
,
style_img_num
)
class
ArgsParser
(
ArgumentParser
):
def
__init__
(
self
):
super
(
ArgsParser
,
self
).
__init__
(
formatter_class
=
RawDescriptionHelpFormatter
)
self
.
add_argument
(
"-c"
,
"--config"
,
help
=
"configuration file to use"
)
self
.
add_argument
(
"--style_image"
,
default
=
"examples/style_images/1.jpg"
,
help
=
"tag for marking worker"
)
self
.
add_argument
(
"--text_corpus"
,
default
=
"PaddleOCR"
,
help
=
"tag for marking worker"
)
self
.
add_argument
(
"--language"
,
default
=
"en"
,
help
=
"tag for marking worker"
)
def
parse_args
(
self
,
argv
=
None
):
args
=
super
(
ArgsParser
,
self
).
parse_args
(
argv
)
assert
args
.
config
is
not
None
,
\
"Please specify --config=configure_file_path."
return
args
if
__name__
==
'__main__'
:
if
__name__
==
'__main__'
:
# batch_synth_images()
# batch_synth_images()
synth_image
()
synth_image
()
style_text_rec/utils/config.py
浏览文件 @
f03dcd60
...
@@ -98,6 +98,12 @@ class ArgsParser(ArgumentParser):
...
@@ -98,6 +98,12 @@ class ArgsParser(ArgumentParser):
action
=
'append'
,
action
=
'append'
,
default
=
[],
default
=
[],
help
=
'config options to be overridden'
)
help
=
'config options to be overridden'
)
self
.
add_argument
(
"--style_image"
,
default
=
"examples/style_images/1.jpg"
,
help
=
"tag for marking worker"
)
self
.
add_argument
(
"--text_corpus"
,
default
=
"PaddleOCR"
,
help
=
"tag for marking worker"
)
self
.
add_argument
(
"--language"
,
default
=
"en"
,
help
=
"tag for marking worker"
)
def
parse_args
(
self
,
argv
=
None
):
def
parse_args
(
self
,
argv
=
None
):
args
=
super
(
ArgsParser
,
self
).
parse_args
(
argv
)
args
=
super
(
ArgsParser
,
self
).
parse_args
(
argv
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录