README.md

简介
--------
本OCR任务是识别图片单行的字母信息，基于attention的seq2seq结构。 运行本目录下的程序示例需要使用PaddlePaddle develop最新版本。

## 代码结构
```
.
|-- data.py          # 数据读取
|-- eval.py          # 评估脚本
|-- images           # 测试图片
|-- predict.py       # 预测脚本
|-- seq2seq_attn.py  # 模型
|-- train.py         # 训练脚本
`-- utility.py       # 公共模块
```

## 训练/评估/预测流程

- 设置GPU环境:

```
export CUDA_VISIBLE_DEVICES=0
```

- 训练

```
python train.py
```

更多参数可以通过`--help`查看。


- 动静切换


```
python train.py --dynamic=True
```


- 评估

```
python eval.py --init_model=checkpoint/final
```


- 预测

目前不支持动态图预测

```
python predict.py --init_model=checkpoint/final --image_path=images/ --dynamic=False --beam_size=3
```

预测结果如下:

```
Image 1: images/112_chubbiness_13557.jpg
0: chubbines
1: chubbiness
2: chubbinesS
Image 2: images/177_Interfiled_40185.jpg
0: Interflied
1: Interfiled
2: InterfIled
Image 3: images/325_dame_19109.jpg
0: da
1: damo
2: dame
Image 4: images/368_fixtures_29232.jpg
0: firtures
1: Firtures
2: fixtures
```