Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
weixin_41840029
PaddleOCR
提交
f03dcd60
P
PaddleOCR
项目概览
weixin_41840029
/
PaddleOCR
与 Fork 源项目一致
Fork自
PaddlePaddle / PaddleOCR
通知
1
Star
1
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
PaddleOCR
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
提交
f03dcd60
编写于
12月 15, 2020
作者:
W
weishengyu
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
dbg
上级
8bce9baa
变更
3
显示空白变更内容
内联
并排
Showing
3 changed file
with
22 addition
and
31 deletion
+22
-31
doc/doc_ch/style_text_rec.md
doc/doc_ch/style_text_rec.md
+16
-11
style_text_rec/tools/synth_image.py
style_text_rec/tools/synth_image.py
+0
-20
style_text_rec/utils/config.py
style_text_rec/utils/config.py
+6
-0
未找到文件。
doc/doc_ch/style_text_rec.md
浏览文件 @
f03dcd60
## Style Text Rec
### 目录
[TOC]
[
工具简介
](
#工具简介
)
[
环境配置
](
#环境配置
)
[
快速上手
](
#快速上手
)
[
高级使用
](
#高级使用
)
[
应用示例
](
#应用示例
)
### 工具简介
<div
align=
"center"
>
...
...
@@ -25,7 +28,7 @@ Style-Text是对百度自研文本编辑算法《Editing Text in the Wild》中
```
bash
cd
style_text_rec
wget
/
https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/style_text_models.zip
wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/style_text_models.zip
unzip style_text_models.zip
```
...
...
@@ -52,15 +55,16 @@ python3 -m tools.synth_image -c configs/config.yml
1.
运行后,会生成
`fake_busion.jpg`
,即为最终结果。
<div
align=
"center"
>
<img
src=
"../imgs_style_text/4.jpg"
width=
"
8
00"
>
<img
src=
"../imgs_style_text/4.jpg"
width=
"
3
00"
>
</div>
除此之外,程序还会生成并保存中间结果:
*
`fake_bg.jpg`
:为风格参考图去掉文字后的背景;
*
`fake_text.jpg`
:是用提供的字符串,仿照风格参考图中文字的风格,生成在灰色背景上的文字图片。
2.
如果您想尝试其他风格图像和文字的效果,可以在
`tools/synth_image.py`
中修改:
*
`img = cv2.imread("examples/style_images/1.jpg")`
:请在此处修改风格图像的目录;
*
`corpus = "PaddleOCR"`
:请在此处修改要使用的语料文本
2.
如果您想尝试其他风格图像和文字的效果,可以添加style_image和text_corpus参数:
```
python
python3
-
m
tools
.
synth_image
-
c
configs
/
config
.
yml
--
style_image
examples
/
style_images
/
2.j
pg
--
text_corpus
PaddleOCR
```
*
注意:请修改语言选项(
`language = "en"`
)和语料相对应,目前我们支持英文、简体中文和韩语。
3.
在
`tools/synth_image.py`
中,我们还提供了一个
`batch_synth_images`
方法,可以两两组合语料和图片,批量生成一批数据。
...
...
@@ -102,8 +106,8 @@ python3 -m tools.synth_image -c configs/config.yml
在完成上述操作后,即可得到用于OCR识别的合成数据集,接下来请参考
[
OCR识别文档
](
https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md#%E5%90%AF%E5%8A%A8%E8%AE%AD%E7%BB%83
)
,完成训练。
### 项目结构
.
```
style_text_rec
|-- arch
| |-- base_module.py
| |-- decoder.py
...
...
@@ -141,3 +145,4 @@ python3 -m tools.synth_image -c configs/config.yml
|-- logging.py
|-- math_functions.py
`-- sys_funcs.py
```
\ No newline at end of file
style_text_rec/tools/synth_image.py
浏览文件 @
f03dcd60
...
...
@@ -77,26 +77,6 @@ def batch_synth_images():
print
(
cno
,
corpus_num
,
sno
,
style_img_num
)
class
ArgsParser
(
ArgumentParser
):
def
__init__
(
self
):
super
(
ArgsParser
,
self
).
__init__
(
formatter_class
=
RawDescriptionHelpFormatter
)
self
.
add_argument
(
"-c"
,
"--config"
,
help
=
"configuration file to use"
)
self
.
add_argument
(
"--style_image"
,
default
=
"examples/style_images/1.jpg"
,
help
=
"tag for marking worker"
)
self
.
add_argument
(
"--text_corpus"
,
default
=
"PaddleOCR"
,
help
=
"tag for marking worker"
)
self
.
add_argument
(
"--language"
,
default
=
"en"
,
help
=
"tag for marking worker"
)
def
parse_args
(
self
,
argv
=
None
):
args
=
super
(
ArgsParser
,
self
).
parse_args
(
argv
)
assert
args
.
config
is
not
None
,
\
"Please specify --config=configure_file_path."
return
args
if
__name__
==
'__main__'
:
# batch_synth_images()
synth_image
()
style_text_rec/utils/config.py
浏览文件 @
f03dcd60
...
...
@@ -98,6 +98,12 @@ class ArgsParser(ArgumentParser):
action
=
'append'
,
default
=
[],
help
=
'config options to be overridden'
)
self
.
add_argument
(
"--style_image"
,
default
=
"examples/style_images/1.jpg"
,
help
=
"tag for marking worker"
)
self
.
add_argument
(
"--text_corpus"
,
default
=
"PaddleOCR"
,
help
=
"tag for marking worker"
)
self
.
add_argument
(
"--language"
,
default
=
"en"
,
help
=
"tag for marking worker"
)
def
parse_args
(
self
,
argv
=
None
):
args
=
super
(
ArgsParser
,
self
).
parse_args
(
argv
)
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录