diff --git a/doc/doc_ch/style_text_rec.md b/doc/doc_ch/style_text_rec.md
index 9562040b930721a5019ea659d63ce5b6ffe8474b..d84c8d09282f4b11956ef9faf1c9d7a73674c07f 100644
--- a/doc/doc_ch/style_text_rec.md
+++ b/doc/doc_ch/style_text_rec.md
@@ -1,8 +1,11 @@
## Style Text Rec
### 目录
-
-[TOC]
+[工具简介](#工具简介)
+[环境配置](#环境配置)
+[快速上手](#快速上手)
+[高级使用](#高级使用)
+[应用示例](#应用示例)
### 工具简介
@@ -25,7 +28,7 @@ Style-Text是对百度自研文本编辑算法《Editing Text in the Wild》中
```bash
cd style_text_rec
-wget /https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/style_text_models.zip
+wget https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/style_text_models.zip
unzip style_text_models.zip
```
@@ -52,15 +55,16 @@ python3 -m tools.synth_image -c configs/config.yml
1. 运行后,会生成`fake_busion.jpg`,即为最终结果。
-
+
除此之外,程序还会生成并保存中间结果:
* `fake_bg.jpg`:为风格参考图去掉文字后的背景;
* `fake_text.jpg`:是用提供的字符串,仿照风格参考图中文字的风格,生成在灰色背景上的文字图片。
-
-2. 如果您想尝试其他风格图像和文字的效果,可以在`tools/synth_image.py`中修改:
- * `img = cv2.imread("examples/style_images/1.jpg")`:请在此处修改风格图像的目录;
- * `corpus = "PaddleOCR"`:请在此处修改要使用的语料文本
+
+2. 如果您想尝试其他风格图像和文字的效果,可以添加style_image和text_corpus参数:
+```python
+python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_images/2.jpg --text_corpus PaddleOCR
+```
* 注意:请修改语言选项(`language = "en"`)和语料相对应,目前我们支持英文、简体中文和韩语。
3. 在`tools/synth_image.py`中,我们还提供了一个`batch_synth_images`方法,可以两两组合语料和图片,批量生成一批数据。
@@ -102,8 +106,8 @@ python3 -m tools.synth_image -c configs/config.yml
在完成上述操作后,即可得到用于OCR识别的合成数据集,接下来请参考[OCR识别文档](https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/recognition.md#%E5%90%AF%E5%8A%A8%E8%AE%AD%E7%BB%83),完成训练。
### 项目结构
-
-.
+```
+style_text_rec
|-- arch
| |-- base_module.py
| |-- decoder.py
@@ -140,4 +144,5 @@ python3 -m tools.synth_image -c configs/config.yml
|-- load_params.py
|-- logging.py
|-- math_functions.py
- `-- sys_funcs.py
\ No newline at end of file
+ `-- sys_funcs.py
+```
\ No newline at end of file
diff --git a/style_text_rec/tools/synth_image.py b/style_text_rec/tools/synth_image.py
index 22cfb9ee2b862f5549313c11b3e48a54a4bebd3f..7c0124b347ac71fd9ea447d192fce19174e23d0a 100644
--- a/style_text_rec/tools/synth_image.py
+++ b/style_text_rec/tools/synth_image.py
@@ -77,26 +77,6 @@ def batch_synth_images():
print(cno, corpus_num, sno, style_img_num)
-class ArgsParser(ArgumentParser):
- def __init__(self):
- super(ArgsParser, self).__init__(
- formatter_class=RawDescriptionHelpFormatter)
- self.add_argument("-c", "--config", help="configuration file to use")
- self.add_argument(
- "--style_image", default="examples/style_images/1.jpg", help="tag for marking worker")
- self.add_argument(
- "--text_corpus", default="PaddleOCR", help="tag for marking worker")
- self.add_argument(
- "--language", default="en", help="tag for marking worker")
-
- def parse_args(self, argv=None):
- args = super(ArgsParser, self).parse_args(argv)
- assert args.config is not None, \
- "Please specify --config=configure_file_path."
- return args
-
-
-
if __name__ == '__main__':
# batch_synth_images()
synth_image()
diff --git a/style_text_rec/utils/config.py b/style_text_rec/utils/config.py
index d028b7c454e293630a15efd8873238fbada88e0a..b2f8a618a838db361da4867e00df8dcd619f9f3d 100644
--- a/style_text_rec/utils/config.py
+++ b/style_text_rec/utils/config.py
@@ -98,6 +98,12 @@ class ArgsParser(ArgumentParser):
action='append',
default=[],
help='config options to be overridden')
+ self.add_argument(
+ "--style_image", default="examples/style_images/1.jpg", help="tag for marking worker")
+ self.add_argument(
+ "--text_corpus", default="PaddleOCR", help="tag for marking worker")
+ self.add_argument(
+ "--language", default="en", help="tag for marking worker")
def parse_args(self, argv=None):
args = super(ArgsParser, self).parse_args(argv)