diff --git a/README.md b/README.md index bc75fe9ee68a093c53a7a26a1eefd12740e0f6ab..47d3a99ba14921f638bcab4026bb7b716b8cd822 100644 --- a/README.md +++ b/README.md @@ -97,7 +97,7 @@ For a new language request, please refer to [Guideline for new language_requests - [Benchmark](./doc/doc_en/benchmark_en.md) - Data Annotation and Synthesis - [Semi-automatic Annotation Tool: PPOCRLabel](./PPOCRLabel/README.md) - - [Data Synthesis Tool: Style_Edit](./StyleTextRec/README.md) + - [Data Synthesis Tool: Style-Text](./StyleText/README.md) - [Other Data Annotation Tools](./doc/doc_en/data_annotation_en.md) - [Other Data Synthesis Tools](./doc/doc_en/data_synthesis_en.md) - Datasets diff --git a/StyleText/README.md b/StyleText/README.md index d427d2eaf5914148ea12f68e1c0c3eb17ea0db6f..6b5985c122cfb3d8381e618fa4d7a193237703bf 100644 --- a/StyleText/README.md +++ b/StyleText/README.md @@ -153,7 +153,7 @@ After adding the above synthetic data for training, the accuracy of the recognit ### Code Structure ``` -style_text_rec +StyleText |-- arch // Network module files. | |-- base_module.py | |-- decoder.py diff --git a/StyleText/README_ch.md b/StyleText/README_ch.md index 51e3cda4aba7bba1f7d5bc0680e6a3a32ffe4a4d..eb557ff24547f228610ffa2cbbaf993e2b4569c3 100644 --- a/StyleText/README_ch.md +++ b/StyleText/README_ch.md @@ -2,6 +2,7 @@ ## Style Text + ### 目录 - [一、工具简介](#工具简介) - [二、环境配置](#环境配置) @@ -88,7 +89,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_ #### 批量合成 -在实际应用场景中,经常需要批量合成图片,补充到训练集中。StyleText可以使用一批风格图片和语料,批量合成数据。合成过程如下: +在实际应用场景中,经常需要批量合成图片,补充到训练集中。Style-Text可以使用一批风格图片和语料,批量合成数据。合成过程如下: 1. 在`configs/dataset_config.yml`中配置目标场景风格图像和语料的路径,具体如下: @@ -103,7 +104,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_ * `language`:语料的语种; * `corpus_file`: 语料文件路径。 - StyleText也提供了一批中英韩5万张通用场景数据用作文本风格图像,便于合成场景丰富的文本图像,下图给出了一些示例。 + Style-Text也提供了一批中英韩5万张通用场景数据用作文本风格图像,便于合成场景丰富的文本图像,下图给出了一些示例。 中英韩5万张通用场景数据: [下载地址](https://paddleocr.bj.bcebos.com/dygraph_v2.0/style_text/chkoen_5w.tar) @@ -119,7 +120,7 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_ ### 四、应用案例 -下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用StyleText合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例: +下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用Style-Text合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例:
@@ -135,40 +136,41 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_ ### 五、代码结构 + ``` -style_text_rec -|-- arch +StyleText +|-- arch // 网络结构定义文件 | |-- base_module.py | |-- decoder.py | |-- encoder.py | |-- spectral_norm.py | `-- style_text_rec.py -|-- configs +|-- configs // 配置文件 | |-- config.yml | `-- dataset_config.yml -|-- engine -| |-- corpus_generators.py -| |-- predictors.py -| |-- style_samplers.py -| |-- synthesisers.py -| |-- text_drawers.py -| `-- writers.py -|-- examples +|-- engine // 数据合成引擎 +| |-- corpus_generators.py // 从文本采样或随机生成语料 +| |-- predictors.py // 调用网络生成数据 +| |-- style_samplers.py // 采样风格图片 +| |-- synthesisers.py // 调度各个模块,合成数据 +| |-- text_drawers.py // 生成标准文字图片,用作输入 +| `-- writers.py // 将合成的图片和标签写入本地目录 +|-- examples // 示例文件 | |-- corpus | | `-- example.txt | |-- image_list.txt | `-- style_images | |-- 1.jpg | `-- 2.jpg -|-- fonts +|-- fonts // 字体文件 | |-- ch_standard.ttf | |-- en_standard.ttf | `-- ko_standard.ttf -|-- tools +|-- tools // 程序入口 | |-- __init__.py -| |-- synth_dataset.py -| `-- synth_image.py -`-- utils +| |-- synth_dataset.py // 批量合成数据 +| `-- synth_image.py // 合成单张图片 +`-- utils // 其他基础功能模块 |-- config.py |-- load_params.py |-- logging.py