未验证 提交 57e6edd9 编写于 作者: D dyning 提交者: GitHub

Update README_ch.md

上级 b1bff7ae
......@@ -4,7 +4,7 @@
- [一、工具简介](#工具简介)
- [二、环境配置](#环境配置)
- [三、快速上手](#快速上手)
- [四、应用示例](#应用示)
- [四、应用案例](#应用案)
<a name="工具简介"></a>
### 一、工具简介
......@@ -111,23 +111,23 @@ python3 -m tools.synth_image -c configs/config.yml --style_image examples/style_
python3 -m tools.synth_dataset -t 1 -c configs/dataset_config.yml
```
<a name="应用示例"></a>
### 四、应用示例
<a name="应用案例"></a>
### 四、应用案例
下面以金属表面英文数字识别和通用韩语识别两个场景为例,说明使用StyleText合成数据,来提升文本识别效果的实际案例。下图给出了一些真实场景图像和合成图像的示例:
在完成上述操作后,即可得到用于OCR识别的合成数据集。在实用场景中,我们经常遇到数据量不足的情况,这时可以使用已有数据作为style_input,合成数据。
下面给出了一些数据集生成的示例:
<div align="center">
<img src="doc/images/6.png" width="800">
</div>
在添加这些合成数据进行训练后,识别模型的效果得到了显著提升,如下表所示:
在添加上述合成数据进行训练后,识别模型的效果提升,如下表所示:
| 场景 | 字符 | 原始数据 | 测试数据 | 只使用原始数据</br>识别准确率 | 新增合成数据 | 同时使用合成数据</br>识别准确率 | 指标提升 |
| -------- | ---------- | -------- | -------- | -------------------------- | ------------ | ---------------------- | -------- |
| 金属表面 | 英文和数字 | 2203 | 650 | 0.5938 | 20000 | 0.7546 | 16% |
| 随机背景 | 韩语 | 5631 | 1230 | 0.3012 | 100000 | 0.5057 | 20% |
识别模型的训练方法您可以参考[OCR识别文档](../doc/doc_ch/recognition.md)
识别模型的训练方法可以参考[OCR识别文档](../doc/doc_ch/recognition.md)
### 项目结构
```
style_text_rec
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册