diff --git a/StyleText/README_ch.md b/StyleText/README_ch.md index 3ea54925a5c0a525703d7e96c2dfcaa0a0213277..c2753697618955d40f63e1d5e9f0c29a867d1b12 100644 --- a/StyleText/README_ch.md +++ b/StyleText/README_ch.md @@ -4,7 +4,7 @@ - [一、工具简介](#工具简介) - [二、环境配置](#环境配置) - [三、快速上手](#快速上手) -- [四、应用示例](#应用示例) +- [四、应用案例](#应用案例) ### 一、工具简介 @@ -111,23 +111,23 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_ python3 -m tools.synth_dataset -t 1 -c configs/dataset_config.yml ``` - -### 四、应用示例 + +### 四、应用案例 +下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用StyleText合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例: -在完成上述操作后,即可得到用于OCR识别的合成数据集。在实用场景中,我们经常遇到数据量不足的情况,这时可以使用已有数据作为style_input,合成数据。 -下面给出了一些数据集生成的示例:
-在添加这些合成数据进行训练后,识别模型的效果得到了显著提升,如下表所示: +在添加上述合成数据进行训练后,识别模型的效果提升,如下表所示: | 场景 | 字符 | 原始数据 | 测试数据 | 只使用原始数据
识别准确率 | 新增合成数据 | 同时使用合成数据
识别准确率 | 指标提升 | | -------- | ---------- | -------- | -------- | -------------------------- | ------------ | ---------------------- | -------- | | 金属表面 | 英文和数字 | 2203 | 650 | 0.5938 | 20000 | 0.7546 | 16% | | 随机背景 | 韩语 | 5631 | 1230 | 0.3012 | 100000 | 0.5057 | 20% | -识别模型的训练方法您可以参考[OCR识别文档](../doc/doc_ch/recognition.md) +识别模型的训练方法可以参考[OCR识别文档](../doc/doc_ch/recognition.md) + ### 项目结构 ``` style_text_rec