table_master.yml 3.2 KB
Newer Older
文幕地方's avatar
文幕地方 已提交
1 2 3 4
Global:
  use_gpu: true
  epoch_num: 17
  log_smooth_window: 20
文幕地方's avatar
add ref  
文幕地方 已提交
5
  print_batch_step: 100
文幕地方's avatar
文幕地方 已提交
6 7
  save_model_dir: ./output/table_master/
  save_epoch_step: 17
文幕地方's avatar
add ref  
文幕地方 已提交
8 9 10 11 12 13
  eval_batch_step: [0,  6259]
  cal_metric_during_train: true
  pretrained_model: null
  checkpoints: 
  save_inference_dir: output/table_master/infer
  use_visualdl: false
文幕地方's avatar
文幕地方 已提交
14
  infer_img: ppstructure/docs/table/table.jpg
文幕地方's avatar
add ref  
文幕地方 已提交
15
  save_res_path: ./output/table_master
文幕地方's avatar
文幕地方 已提交
16
  character_dict_path: ppocr/utils/dict/table_master_structure_dict.txt
文幕地方's avatar
add ref  
文幕地方 已提交
17
  infer_mode: false
文幕地方's avatar
文幕地方 已提交
18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
  max_text_length: 500
  process_total_num: 0
  process_cut_num: 0


Optimizer:
  name: Adam
  beta1: 0.9
  beta2: 0.999
  lr:
    name: MultiStepDecay
    learning_rate: 0.001
    milestones: [12, 15]
    gamma: 0.1
    warmup_epoch: 0.02
  regularizer:
文幕地方's avatar
add ref  
文幕地方 已提交
34 35
    name: L2
    factor: 0.0
文幕地方's avatar
文幕地方 已提交
36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67

Architecture:
  model_type: table
  algorithm: TableMaster
  Backbone:
    name: TableResNetExtra
    gcb_config:
      ratio: 0.0625
      headers: 1
      att_scale: False
      fusion_type: channel_add
      layers: [False, True, True, True]
    layers: [1,2,5,3]
  Head:
    name: TableMasterHead
    hidden_size: 512
    headers: 8
    dropout: 0
    d_ff: 2024
    max_text_length: 500

Loss:
  name: TableMasterLoss
  ignore_index: 42 # set to len of dict + 3

PostProcess:
  name: TableMasterLabelDecode
  box_shape: pad

Metric:
  name: TableMetric
  main_indicator: acc
文幕地方's avatar
add ref  
文幕地方 已提交
68
  compute_bbox_metric: False
文幕地方's avatar
文幕地方 已提交
69 70 71 72

Train:
  dataset:
    name: PubTabDataSet
文幕地方's avatar
add ref  
文幕地方 已提交
73 74
    data_dir: train_data/table/pubtabnet/train/
    label_file_list: [train_data/table/pubtabnet/PubTabNet_2.0.0_train.jsonl]
文幕地方's avatar
文幕地方 已提交
75
    transforms:
文幕地方's avatar
add ref  
文幕地方 已提交
76
      - DecodeImage:
文幕地方's avatar
文幕地方 已提交
77 78 79 80 81 82 83 84 85 86 87 88
          img_mode: BGR
          channel_first: False
      - TableMasterLabelEncode:
          learn_empty_box: False
          merge_no_span_structure: True
          replace_empty_cell_token: True
      - ResizeTableImage:
          max_len: 480
          resize_bboxes: True
      - PaddingTableImage:
          size: [480, 480]
      - TableBoxEncode:
文幕地方's avatar
add ref  
文幕地方 已提交
89
          use_xywh: True
文幕地方's avatar
文幕地方 已提交
90 91 92 93
      - NormalizeImage:
          scale: 1./255.
          mean: [0.5, 0.5, 0.5]
          std: [0.5, 0.5, 0.5]
文幕地方's avatar
add ref  
文幕地方 已提交
94 95
          order: hwc
      - ToCHWImage: null
文幕地方's avatar
文幕地方 已提交
96
      - KeepKeys:
文幕地方's avatar
add ref  
文幕地方 已提交
97
          keep_keys: [image, structure, bboxes, bbox_masks, shape]
文幕地方's avatar
文幕地方 已提交
98 99
  loader:
    shuffle: True
文幕地方's avatar
add ref  
文幕地方 已提交
100
    batch_size_per_card: 10
文幕地方's avatar
文幕地方 已提交
101
    drop_last: True
文幕地方's avatar
add ref  
文幕地方 已提交
102
    num_workers: 8
文幕地方's avatar
文幕地方 已提交
103 104 105 106

Eval:
  dataset:
    name: PubTabDataSet
文幕地方's avatar
文幕地方 已提交
107
    data_dir: train_data/table/pubtabnet/val/
Z
zhoujun 已提交
108
    label_file_list: [train_data/table/pubtabnet/PubTabNet_2.0.0_val.jsonl]
文幕地方's avatar
文幕地方 已提交
109
    transforms:
文幕地方's avatar
add ref  
文幕地方 已提交
110
      - DecodeImage:
文幕地方's avatar
文幕地方 已提交
111 112 113 114 115 116 117 118 119 120
          img_mode: BGR
          channel_first: False
      - TableMasterLabelEncode:
          learn_empty_box: False
          merge_no_span_structure: True
          replace_empty_cell_token: True
      - ResizeTableImage:
          max_len: 480
          resize_bboxes: True
      - PaddingTableImage:
文幕地方's avatar
add ref  
文幕地方 已提交
121
          size: [480, 480]
文幕地方's avatar
文幕地方 已提交
122
      - TableBoxEncode:
文幕地方's avatar
add ref  
文幕地方 已提交
123
          use_xywh: True
文幕地方's avatar
文幕地方 已提交
124 125
      - NormalizeImage:
          scale: 1./255.
文幕地方's avatar
add ref  
文幕地方 已提交
126 127 128 129
          mean: [0.5, 0.5, 0.5]
          std: [0.5, 0.5, 0.5]
          order: hwc
      - ToCHWImage: null
文幕地方's avatar
文幕地方 已提交
130
      - KeepKeys:
文幕地方's avatar
add ref  
文幕地方 已提交
131
          keep_keys: [image, structure, bboxes, bbox_masks, shape]
文幕地方's avatar
文幕地方 已提交
132 133 134
  loader:
    shuffle: False
    drop_last: False
文幕地方's avatar
add ref  
文幕地方 已提交
135 136
    batch_size_per_card: 10
    num_workers: 8