diff --git a/StyleText/README_ch.md b/StyleText/README_ch.md index 9f6286867533f1be35c263fc31aed2384ecfcb53..9a8eb2d2c98ff497fae5007f48733255843ac372 100644 --- a/StyleText/README_ch.md +++ b/StyleText/README_ch.md @@ -5,7 +5,7 @@ - [二、环境配置](#环境配置) - [三、快速上手](#快速上手) - [四、应用案例](#应用案例) -- [五、项目结构](#项目结构) +- [五、代码结构](#代码结构) ### 一、工具简介 @@ -54,14 +54,15 @@ fusion_generator: ### 三、快速上手 -- 合成单张图 -运行tools/synth_image,合成单张图片: +#### 合成单张图 +输入一张风格图和一段文字语料,运行tools/synth_image,合成单张图片: ```python python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_images/2.jpg --text_corpus PaddleOCR --language en ``` +* 注意:语言选项和语料相对应,目前我们支持英文、简体中文和韩语。 例如,输入如下图片和语料"PaddleOCR":
- +
得到结果fake_fusion.jpg:
@@ -69,11 +70,15 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
除此之外,程序还会生成并保存中间结果: * `fake_bg.jpg`:为风格参考图去掉文字后的背景; +
+ +
* `fake_text.jpg`:是用提供的字符串,仿照风格参考图中文字的风格,生成在灰色背景上的文字图片。 +
+ +
- * 注意:语言选项和语料相对应,目前我们支持英文、简体中文和韩语。 - -- 批量合成 +#### 批量合成 在实际应用场景中,经常需要批量合成图片,补充到训练集中。StyleText可以使用一批风格图片和语料,批量合成数据。合成过程如下: 首先,需要风格图片作为合成图片的参考依据,这些数据可以是用作训练OCR识别模型的数据集。本例中使用带有标注文件的数据集作为风格图片. @@ -121,8 +126,8 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_ | 随机背景 | 韩语 | 5631 | 1230 | 0.3012 | 100000 | 0.5057 | 20% | - -### 五、项目结构 + +### 五、代码结构 ``` style_text_rec |-- arch diff --git a/StyleText/doc/images/7.jpg b/StyleText/doc/images/7.jpg new file mode 100644 index 0000000000000000000000000000000000000000..60a4e0ee6ae3d42cc43c43747d72a837bc170f9d Binary files /dev/null and b/StyleText/doc/images/7.jpg differ diff --git a/StyleText/doc/images/8.jpg b/StyleText/doc/images/8.jpg new file mode 100644 index 0000000000000000000000000000000000000000..fbed5a7bb5368090e612933bba8f57ec1a74a4c4 Binary files /dev/null and b/StyleText/doc/images/8.jpg differ