diff --git a/StyleText/README_ch.md b/StyleText/README_ch.md index 4c5802b9ebeda2a8501206746dbdf5300607cfe1..9f6286867533f1be35c263fc31aed2384ecfcb53 100644 --- a/StyleText/README_ch.md +++ b/StyleText/README_ch.md @@ -5,6 +5,7 @@ - [二、环境配置](#环境配置) - [三、快速上手](#快速上手) - [四、应用案例](#应用案例) +- [五、项目结构](#项目结构) ### 一、工具简介 @@ -53,15 +54,16 @@ fusion_generator: ### 三、快速上手 -#### 合成单张图 - -1. 运行tools/synth_image,生成示例图片: - +- 合成单张图 +运行tools/synth_image,合成单张图片: ```python -python3 -m tools.synth_image -c configs/config.yml +python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_images/2.jpg --text_corpus PaddleOCR --language en ``` - -2. 运行后,会生成`fake_busion.jpg`,即为最终结果。 +例如,输入如下图片和语料"PaddleOCR": +
+ +
+得到结果fake_fusion.jpg:
@@ -69,18 +71,10 @@ python3 -m tools.synth_image -c configs/config.yml * `fake_bg.jpg`:为风格参考图去掉文字后的背景; * `fake_text.jpg`:是用提供的字符串,仿照风格参考图中文字的风格,生成在灰色背景上的文字图片。 -3. 如果您想尝试其他风格图像和文字的效果,可以添加style_image,text_corpus和language参数: -```python -python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_images/2.jpg --text_corpus PaddleOCR --language en -``` * 注意:语言选项和语料相对应,目前我们支持英文、简体中文和韩语。 -4. 在`tools/synth_image.py`中,我们还提供了一个`batch_synth_images`方法,可以两两组合语料和图片,批量生成一批数据。 - -#### 批量合成 - -在开始合成数据前,需要准备一些素材。 - +- 批量合成 +在实际应用场景中,经常需要批量合成图片,补充到训练集中。StyleText可以使用一批风格图片和语料,批量合成数据。合成过程如下: 首先,需要风格图片作为合成图片的参考依据,这些数据可以是用作训练OCR识别模型的数据集。本例中使用带有标注文件的数据集作为风格图片. 1. 在`configs/dataset_config.yml`中配置输入数据路径。 @@ -127,7 +121,8 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_ | 随机背景 | 韩语 | 5631 | 1230 | 0.3012 | 100000 | 0.5057 | 20% | -### 项目结构 + +### 五、项目结构 ``` style_text_rec |-- arch