README.md 975 字节
Newer Older
H
Hongyu Liu 已提交
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
DyGraph模式下ocr recognition实现
========

简介
--------
ocr任务是识别图片单行的字母信息,在动态图下使用了带attention的seq2seq结构,静态图实现可以参考([ocr recognition](https://github.com/PaddlePaddle/models/tree/develop/PaddleCV/ocr_recognition)
运行本目录下的程序示例需要使用PaddlePaddle develop最新版本。


## 代码结构
```
└── train.py     # 训练脚本。
└── data_reader.py     # 数据读取。
└── utility     # 基础的函数。
```

## 使用的数据

教程中使用`ocr attention`数据集作为训练数据,该数据集通过`paddle.dataset`模块自动下载到本地。

## 训练测试ocr recognition

在GPU单卡上训练ocr recognition:

```
env CUDA_VISIBLE_DEVICES=0 python train.py
```

这里`CUDA_VISIBLE_DEVICES=0`表示是执行在0号设备卡上,请根据自身情况修改这个参数。

## 效果

在test测试集合上,最好的效果为82.0%