README.md

DyGraph模式下ocr recognition实现
========

简介
--------
ocr任务是识别图片单行的字母信息，在动态图下使用了带attention的seq2seq结构，静态图实现可以参考（[ocr recognition](https://github.com/PaddlePaddle/models/tree/develop/PaddleCV/ocr_recognition)）
运行本目录下的程序示例需要使用PaddlePaddle develop最新版本。


## 代码结构
```
└── train.py     # 训练脚本。
└── data_reader.py     # 数据读取。
└── utility     # 基础的函数。
```

## 使用的数据

教程中使用`ocr attention`数据集作为训练数据，该数据集通过`paddle.dataset`模块自动下载到本地。

## 训练测试ocr recognition

在GPU单卡上训练ocr recognition:

```
env CUDA_VISIBLE_DEVICES=0 python train.py
```

这里`CUDA_VISIBLE_DEVICES=0`表示是执行在0号设备卡上，请根据自身情况修改这个参数。

## 效果

在test测试集合上，最好的效果为82.0%