config.md 6.0 KB
Newer Older
T
tink2123 已提交
1 2 3 4 5 6 7 8 9 10
# 可选参数列表

以下列表可以通过`--help`查看

|         FLAG             |     支持脚本    |        用途        |      默认值       |         备注         |
| :----------------------: | :------------: | :---------------: | :--------------: | :-----------------: |
|          -c              |      ALL       |  指定配置文件  |  None  |  **配置模块说明请参考 参数介绍** |
|          -o              |      ALL       |  设置配置文件里的参数内容  |  None  |  使用-o配置相较于-c选择的配置文件具有更高的优先级。例如:`-o Global.use_gpu=false`  |  


11
## 配置文件 Global 参数介绍
T
tink2123 已提交
12

T
tink2123 已提交
13 14 15
`rec_chinese_lite_train.yml` 为例


T
tink2123 已提交
16 17
|         字段             |            用途                |      默认值       |            备注            |
| :----------------------: |  :---------------------:   | :--------------:  |   :--------------------:   |
T
tink2123 已提交
18
|      algorithm           |    设置算法                    |  与配置文件同步   |     选择模型,支持模型请参考[简介](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/README.md) |
T
tink2123 已提交
19
|      use_gpu             |    设置代码运行场所            |       true        |                \                 |
T
tink2123 已提交
20 21 22
|      epoch_num           |    最大训练epoch数             |       3000        |                \                 |
|      log_smooth_window   |    滑动窗口大小            |       20          |                \                 |
|      print_batch_step    |    设置打印log间隔         |       10          |                \                 |
T
tink2123 已提交
23
|      save_model_dir      |    设置模型保存路径        |  output/{算法名称}  |                \                 |
T
tink2123 已提交
24
|      save_epoch_step     |    设置模型保存间隔        |       3           |                \                 |
L
LDOUBLEV 已提交
25
|      eval_batch_step     |    设置模型评估间隔        | 2000 或 [1000, 2000]        | 2000 表示每2000次迭代评估一次,[1000, 2000]表示从1000次迭代开始,每2000次评估一次   |
T
tink2123 已提交
26 27 28 29
|train_batch_size_per_card |  设置训练时单卡batch size    |         256         |                \                 |
| test_batch_size_per_card |  设置评估时单卡batch size    |         256         |                \                 |
|      image_shape         |    设置输入图片尺寸        |   [3, 32, 100]    |                \                 |
|      max_text_length     |    设置文本最大长度        |       25          |                \                 |
T
tink2123 已提交
30 31 32
|      character_type      |    设置字符类型            |       ch          |    en/ch, en时将使用默认dict,ch时使用自定义dict|
|      character_dict_path |    设置字典路径            |  ./ppocr/utils/ic15_dict.txt  |    \                 |
|      loss_type           |    设置 loss 类型              |       ctc         |    支持两种loss: ctc / attention |
33
|       distort            |    设置是否使用数据增强          |       false       |  设置为true时,将在训练时随机进行扰动,支持的扰动操作可阅读[img_tools.py](https://github.com/PaddlePaddle/PaddleOCR/blob/develop/ppocr/data/rec/img_tools.py)                 |
T
tink2123 已提交
34
|       use_space_char     |    设置是否识别空格             |        false      |          仅在 character_type=ch 时支持空格                 |
T
tink2123 已提交
35 36
|      reader_yml          |    设置reader配置文件          |  ./configs/rec/rec_icdar15_reader.yml  |  \          |
|      pretrain_weights    |    加载预训练模型路径      |  ./pretrain_models/CRNN/best_accuracy  |  \          |
T
tink2123 已提交
37
|      checkpoints         |    加载模型参数路径            |       None        |    用于中断后加载参数继续训练 |
T
tink2123 已提交
38 39
|      save_inference_dir  |    inference model 保存路径 |          None        |    用于保存inference model |

T
tink2123 已提交
40 41 42 43 44 45 46 47 48 49 50
## 配置文件 Reader 系列参数介绍

`rec_chinese_reader.yml` 为例

|         字段             |            用途                |      默认值       |            备注            |
| :----------------------: |  :---------------------:   | :--------------:  |   :--------------------:   |
|      reader_function     |    选择数据读取方式        |  ppocr.data.rec.dataset_traversal,SimpleReader  | 支持SimpleReader / LMDBReader 两种数据读取方式 |
|      num_workers             |    设置数据读取线程数            |       8        |                \                 |
|      img_set_dir          |    数据集路径             |       ./train_data        |                \                 |
|      label_file_path      |    数据标签路径           |       ./train_data/rec_gt_train.txt| \    |
|      infer_img            |    预测图像文件夹路径     |       ./infer_img | \|
T
tink2123 已提交
51 52 53 54 55 56 57 58 59 60 61 62

## 配置文件 Optimizer 系列参数介绍

`rec_icdar15_train.yml` 为例

|         字段             |            用途            |      默认值        |            备注             |
| :---------------------: |  :---------------------:   | :--------------:  |   :--------------------:   |
|         function        |         选择优化器          |  pocr.optimizer,AdamDecay  |  目前只支持Adam方式  |
|         base_lr         |      设置初始学习率          |       0.0005      |               \             |
|         beta1           |    设置一阶矩估计的指数衰减率  |       0.9         |               \             |
|         beta2           |    设置二阶矩估计的指数衰减率  |     0.999         |               \             |
|         decay           |         是否使用decay       |    \              |               \             |
T
tink2123 已提交
63
|      function(decay)    |         设置decay方式       |   cosine_decay    |       目前只支持cosin_decay  |
T
tink2123 已提交
64 65
|      step_each_epoch    |      每个epoch包含多少次迭代  |         20       | 计算方式:total_image_num / (batch_size_per_card * card_size) |
|        total_epoch      |    总共迭代多少个epoch        |       1000      | 与Global.epoch_num 一致        |