From c85036dd1ad7b7511114bf6561c07b86fc10877c Mon Sep 17 00:00:00 2001 From: tink2123 Date: Thu, 14 May 2020 15:55:56 +0800 Subject: [PATCH] change pretrain and label path --- doc/config.md | 22 +++++++++++----------- doc/recognition.md | 14 +++++++++++++- 2 files changed, 24 insertions(+), 12 deletions(-) diff --git a/doc/config.md b/doc/config.md index 282a6bfb..1626bb96 100644 --- a/doc/config.md +++ b/doc/config.md @@ -12,18 +12,18 @@ | 字段 | 用途 | 默认值 | 备注 | | :----------------------: | :---------------------: | :--------------: | :--------------------: | -| algorithm | 设置算法 | CRNN | 选择模型,支持模型请参考[简介]() | +| algorithm | 设置算法 | CRNN | 选择模型,支持模型请参考[简介](../../README.md) | | use_gpu | 设置代码运行场所 | true | \ | -| epoch_num | 最大训练epoch数 | 3000 | \ | -| log_smooth_window | 滑动窗口大小 | 20 | \ | -| print_batch_step | 设置打印log间隔 | 10 | \ | -| save_model_dir | 设置模型保存路径 | output/rec_CRNN | \ | -| save_epoch_step | 设置模型保存间隔 | 3 | \ | -| eval_batch_step | 设置模型评估间隔 | 2000 | \ | -|train_batch_size_per_card | 设置训练时单卡batch size | 256 | \ | -| test_batch_size_per_card | 设置评估时单卡batch size | 256 | \ | -| image_shape | 设置输入图片尺寸 | [3, 32, 100] | \ | -| max_text_length | 设置文本最大长度 | 25 | \ | +| epoch_num | 最大训练epoch数 | 3000 | \ | +| log_smooth_window | 滑动窗口大小 | 20 | \ | +| print_batch_step | 设置打印log间隔 | 10 | \ | +| save_model_dir | 设置模型保存路径 | output/rec_CRNN | \ | +| save_epoch_step | 设置模型保存间隔 | 3 | \ | +| eval_batch_step | 设置模型评估间隔 | 2000 | \ | +|train_batch_size_per_card | 设置训练时单卡batch size | 256 | \ | +| test_batch_size_per_card | 设置评估时单卡batch size | 256 | \ | +| image_shape | 设置输入图片尺寸 | [3, 32, 100] | \ | +| max_text_length | 设置文本最大长度 | 25 | \ | | character_type | 设置字符类型 | ch | en/ch, en时将使用默认dict,ch时使用自定义dict| | character_dict_path | 设置字典路径 | ./ppocr/utils/ic15_dict.txt | \ | | loss_type | 设置 loss 类型 | ctc | 支持两种loss: ctc / attention | diff --git a/doc/recognition.md b/doc/recognition.md index ab1e3533..d22e0c65 100644 --- a/doc/recognition.md +++ b/doc/recognition.md @@ -98,6 +98,18 @@ word_dict.txt 每行有一个单字,将字符与数字索引映射在一起, PaddleOCR提供了训练脚本、评估脚本和预测脚本,本节将以 CRNN 识别模型为例: +首先下载pretrain model,您可以下载训练好的模型在 icdar2015 数据上进行finetune +`` +cd PaddleOCR/ +# 下载MobileNetV3的预训练模型 +wget -P ./pretrain_models/ https://paddleocr.bj.bcebos.com/rec_mv3_none_bilstm_ctc.tar +# 解压模型参数 +cd pretrain_models +tar -xf rec_mv3_none_bilstm_ctc.tar && rm -rf rec_mv3_none_bilstm_ctc.tar +``` + +开始训练: + ``` # 设置PYTHONPATH路径 export PYTHONPATH=$PYTHONPATH:. @@ -106,7 +118,7 @@ export CUDA_VISIBLE_DEVICES=0,1,2,3 python3 tools/train.py -c configs/rec/rec_icdar15_train.yml ``` -PaddleOCR支持训练和评估交替进行, 可以在 `configs/rec/rec_icdar15_train.yml` 中修改 `eval_batch_step` 设置评估频率,默认每2000个iter评估一次。评估过程中默认将最佳acc模型,保存为 `output/rec_CRNN/best_accuracy` 。 +PaddleOCR支持训练和评估交替进行, 可以在 `configs/rec/rec_icdar15_train.yml` 中修改 `eval_batch_step` 设置评估频率,默认每500个iter评估一次。评估过程中默认将最佳acc模型,保存为 `output/rec_CRNN/best_accuracy` 。 如果验证集很大,测试将会比较耗时,建议减少评估次数,或训练完再进行评估。 -- GitLab