add languages

1edfc308 · tink2123 · b10bd395 · 1edfc308 · 1edfc308 · 1edfc308
17 changed file
--- a/configs/rec/rec_en_lite_train.yml
+++ b/configs/rec/rec_en_lite_train.yml
+Global:
+  algorithm: CRNN
+  use_gpu: true
+  epoch_num: 500
+  log_smooth_window: 20
+  print_batch_step: 10
+  save_model_dir: ./output/en_number
+  save_epoch_step: 3
+  eval_batch_step: 2000
+  train_batch_size_per_card: 256
+  test_batch_size_per_card: 256
+  image_shape: [3, 32, 320]
+  max_text_length: 30
+  character_type: ch
+  character_dict_path: ./ppocr/utils/ic15_dict.txt
+  loss_type: ctc
+  distort: false
+  use_space_char: false
+  reader_yml: ./configs/rec/rec_en_reader.yml
+  pretrain_weights:
+  checkpoints:
+  save_inference_dir:
+  infer_img:
+Architecture:
+  function: ppocr.modeling.architectures.rec_model,RecModel
+Backbone:
+  function: ppocr.modeling.backbones.rec_mobilenet_v3,MobileNetV3
+  scale: 0.5
+  model_name: small
+Head:
+  function: ppocr.modeling.heads.rec_ctc_head,CTCPredict
+  encoder_type: rnn
+  SeqRNN:
+    hidden_size: 48
+Loss:
+  function: ppocr.modeling.losses.rec_ctc_loss,CTCLoss
+Optimizer:
+  function: ppocr.optimizer,AdamDecay
+  l2_decay: 0.00001
+  base_lr: 0.001
+  beta1: 0.9
+  beta2: 0.999
+  decay:
+    function: cosine_decay_warmup
+    warmup_minibatch: 1000
+    step_each_epoch: 6530
+    total_epoch: 500
--- a/configs/rec/rec_en_reader.yml
+++ b/configs/rec/rec_en_reader.yml
+TrainReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  num_workers: 8
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/en_train.txt
+EvalReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/en_eval.txt
+TestReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
--- a/configs/rec/rec_french_lite_train.yml
+++ b/configs/rec/rec_french_lite_train.yml
+Global:
+  algorithm: CRNN
+  use_gpu: true
+  epoch_num: 500
+  log_smooth_window: 20
+  print_batch_step: 10
+  save_model_dir: ./output/rec_french
+  save_epoch_step: 1
+  eval_batch_step: 2000
+  train_batch_size_per_card: 256
+  test_batch_size_per_card: 256
+  image_shape: [3, 32, 320]
+  max_text_length: 25
+  character_type: french
+  character_dict_path: ./ppocr/utils/french_dict.txt
+  loss_type: ctc
+  distort: true
+  use_space_char: false
+  reader_yml: ./configs/rec/rec_french_reader.yml
+  pretrain_weights:
+  checkpoints:
+  save_inference_dir:
+  infer_img:
+Architecture:
+  function: ppocr.modeling.architectures.rec_model,RecModel
+Backbone:
+  function: ppocr.modeling.backbones.rec_mobilenet_v3,MobileNetV3
+  scale: 0.5
+  model_name: small
+Head:
+  function: ppocr.modeling.heads.rec_ctc_head,CTCPredict
+  encoder_type: rnn
+  SeqRNN:
+    hidden_size: 48
+Loss:
+  function: ppocr.modeling.losses.rec_ctc_loss,CTCLoss
+Optimizer:
+  function: ppocr.optimizer,AdamDecay
+  l2_decay: 0.00001
+  base_lr: 0.001
+  beta1: 0.9
+  beta2: 0.999
+  decay:
+    function: cosine_decay
+    step_each_epoch: 254
+    total_epoch: 500
--- a/configs/rec/rec_french_reader.yml
+++ b/configs/rec/rec_french_reader.yml
+TrainReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  num_workers: 8
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/french_train.txt
+EvalReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/french_eval.txt
+TestReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
--- a/configs/rec/rec_ger_lite_train.yml
+++ b/configs/rec/rec_ger_lite_train.yml
+Global:
+  algorithm: CRNN
+  use_gpu: true
+  epoch_num: 500
+  log_smooth_window: 20
+  print_batch_step: 10
+  save_model_dir: ./output/rec_german
+  save_epoch_step: 1
+  eval_batch_step: 2000
+  train_batch_size_per_card: 256
+  test_batch_size_per_card: 256
+  image_shape: [3, 32, 320]
+  max_text_length: 25
+  character_type: german
+  character_dict_path: ./ppocr/utils/german_dict.txt
+  loss_type: ctc
+  distort: true
+  use_space_char: false
+  reader_yml: ./configs/rec/rec_ger_reader.yml
+  pretrain_weights:
+  checkpoints:
+  save_inference_dir:
+  infer_img:
+Architecture:
+  function: ppocr.modeling.architectures.rec_model,RecModel
+Backbone:
+  function: ppocr.modeling.backbones.rec_mobilenet_v3,MobileNetV3
+  scale: 0.5
+  model_name: small
+Head:
+  function: ppocr.modeling.heads.rec_ctc_head,CTCPredict
+  encoder_type: rnn
+  SeqRNN:
+    hidden_size: 48
+Loss:
+  function: ppocr.modeling.losses.rec_ctc_loss,CTCLoss
+Optimizer:
+  function: ppocr.optimizer,AdamDecay
+  l2_decay: 0.00001
+  base_lr: 0.001
+  beta1: 0.9
+  beta2: 0.999
+  decay:
+    function: cosine_decay
+    step_each_epoch: 254
+    total_epoch: 500
--- a/configs/rec/rec_ger_reader.yml
+++ b/configs/rec/rec_ger_reader.yml
+TrainReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  num_workers: 8
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/de_train.txt
+EvalReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/de_eval.txt
+TestReader:
+      reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
--- a/configs/rec/rec_japan_lite_train.yml
+++ b/configs/rec/rec_japan_lite_train.yml
+Global:
+  algorithm: CRNN
+  use_gpu: true
+  epoch_num: 500
+  log_smooth_window: 20
+  print_batch_step: 10
+  save_model_dir: ./output/rec_japan
+  save_epoch_step: 1
+  eval_batch_step: 2000
+  train_batch_size_per_card: 256
+  test_batch_size_per_card: 256
+  image_shape: [3, 32, 320]
+  max_text_length: 25
+  character_type: japan
+  character_dict_path: ./ppocr/utils/japan_dict.txt
+  loss_type: ctc
+  distort: true
+  use_space_char: false
+  reader_yml: ./configs/rec/rec_japan_reader.yml
+  pretrain_weights:
+  checkpoints:
+  save_inference_dir:
+  infer_img:
+Architecture:
+  function: ppocr.modeling.architectures.rec_model,RecModel
+Backbone:
+  function: ppocr.modeling.backbones.rec_mobilenet_v3,MobileNetV3
+  scale: 0.5
+  model_name: small
+Head:
+  function: ppocr.modeling.heads.rec_ctc_head,CTCPredict
+  encoder_type: rnn
+  SeqRNN:
+    hidden_size: 48
+Loss:
+  function: ppocr.modeling.losses.rec_ctc_loss,CTCLoss
+Optimizer:
+  function: ppocr.optimizer,AdamDecay
+  l2_decay: 0.00001
+  base_lr: 0.001
+  beta1: 0.9
+  beta2: 0.999
+  decay:
+    function: cosine_decay
+    step_each_epoch: 254
+    total_epoch: 500
--- a/configs/rec/rec_japan_reader.yml
+++ b/configs/rec/rec_japan_reader.yml
+TrainReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  num_workers: 8
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/japan_train.txt
+EvalReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/japan_eval.txt
+TestReader:
+      reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
--- a/configs/rec/rec_korean_lite_train.yml
+++ b/configs/rec/rec_korean_lite_train.yml
+Global:
+  algorithm: CRNN
+  use_gpu: true
+  epoch_num: 500
+  log_smooth_window: 20
+  print_batch_step: 10
+  save_model_dir: ./output/rec_korean
+  save_epoch_step: 1
+  eval_batch_step: 2000
+  train_batch_size_per_card: 256
+  test_batch_size_per_card: 256
+  image_shape: [3, 32, 320]
+  max_text_length: 25
+  character_type: korean
+  character_dict_path: ./ppocr/utils/korean_dict.txt
+  loss_type: ctc
+  distort: true
+  use_space_char: false
+  reader_yml: ./configs/rec/rec_korean_reader.yml
+  pretrain_weights:
+  checkpoints:
+  save_inference_dir:
+  infer_img:
+Architecture:
+  function: ppocr.modeling.architectures.rec_model,RecModel
+Backbone:
+  function: ppocr.modeling.backbones.rec_mobilenet_v3,MobileNetV3
+  scale: 0.5
+  model_name: small
+Head:
+  function: ppocr.modeling.heads.rec_ctc_head,CTCPredict
+  encoder_type: rnn
+  SeqRNN:
+    hidden_size: 48
+Loss:
+  function: ppocr.modeling.losses.rec_ctc_loss,CTCLoss
+Optimizer:
+  function: ppocr.optimizer,AdamDecay
+  l2_decay: 0.00001
+  base_lr: 0.001
+  beta1: 0.9
+  beta2: 0.999
+  decay:
+    function: cosine_decay
+    step_each_epoch: 254
+    total_epoch: 500
--- a/configs/rec/rec_korean_reader.yml
+++ b/configs/rec/rec_korean_reader.yml
+TrainReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  num_workers: 8
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/korean_train.txt
+EvalReader:
+  reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
+  img_set_dir: ./train_data
+  label_file_path: ./train_data/korean_eval.txt
+TestReader:
+      reader_function: ppocr.data.rec.dataset_traversal,SimpleReader
--- a/ppocr/utils/character.py
+++ b/ppocr/utils/character.py
@@ -29,7 +29,9 @@ class CharacterOps(object):
        if self.character_type == "en":
            self.character_str = "0123456789abcdefghijklmnopqrstuvwxyz"
            dict_character = list(self.character_str)
-        elif self.character_type == "ch":
+        elif self.character_type in [
+                "ch", 'japan', 'korean', 'french', 'german'
+        ]:
            character_dict_path = config['character_dict_path']
            add_space = False
            if 'use_space_char' in config:
@@ -166,7 +168,7 @@ def cal_predicts_accuracy_srn(char_ops,
        cur_label = []
        cur_pred = []
        for j in range(max_text_len):
-            if labels[j + i * max_text_len] != int(char_num-1):  #0
+            if labels[j + i * max_text_len] != int(char_num - 1):  #0
                cur_label.append(labels[j + i * max_text_len][0])
            else:
                break
@@ -178,7 +180,8 @@ def cal_predicts_accuracy_srn(char_ops,
            elif j == len(cur_label) and j == max_text_len:
                acc_num += 1
                break
-            elif j == len(cur_label) and preds[j + i * max_text_len][0] == int(char_num-1):
+            elif j == len(cur_label) and preds[j + i * max_text_len][0] == int(
+                    char_num - 1):
                acc_num += 1
                break
    acc = acc_num * 1.0 / img_num

--- a/ppocr/utils/french_dict.txt
+++ b/ppocr/utils/french_dict.txt
+!
+"
+%
+&
+'
+(
+)
+
+,
+-
+.
+/
+0
+1
+2
+3
+4
+5
+6
+7
+8
+9
+:
+;
+?
+A
+B
+C
+D
+E
+F
+G
+H
+I
+J
+K
+L
+M
+N
+O
+P
+Q
+R
+S
+T
+U
+V
+W
+X
+Y
+Z
+[
+]
+a
+b
+c
+d
+e
+f
+g
+h
+i
+j
+k
+l
+m
+n
+o
+p
+q
+r
+s
+t
+u
+v
+w
+x
+y
+z
+«
+³
+µ
+º
+»
+À
+Á
+Â
+Å
+É
+Ê
+Î
+Ö
+ß
+à
+á
+â
+ä
+å
+æ
+ç
+è
+é
+ê
+ë
+í
+î
+ï
+ñ
+ò
+ó
+ô
+ö
+ø
+ù
+ú
+û
+ü
--- a/ppocr/utils/german_dict.txt
+++ b/ppocr/utils/german_dict.txt
+!
+"
+$
+%
+&
+'
+(
+)
+
+,
+-
+.
+/
+0
+1
+2
+3
+4
+5
+6
+7
+8
+9
+:
+;
+>
+?
+A
+B
+C
+D
+E
+F
+G
+H
+I
+J
+K
+L
+M
+N
+O
+P
+Q
+R
+S
+T
+U
+V
+W
+X
+Y
+Z
+[
+]
+a
+b
+c
+d
+e
+f
+g
+h
+i
+j
+k
+l
+m
+n
+o
+p
+q
+r
+s
+t
+u
+v
+w
+x
+y
+z
+£
+§
+²
+´
+µ
+·
+º
+¼
+½
+¿
+À
+Á
+Ä
+Å
+Ç
+É
+Í
+Ï
+Ô
+Ö
+Ø
+Ù
+Ü
+ß
+à
+á
+â
+ã
+ä
+å
+æ
+ç
+è
+é
+ê
+ë
+í
+ï
+ñ
+ò
+ó
+ô
+ö
+ø
+ù
+ú
+û
+ü
--- a/ppocr/utils/ic15_dict.txt
+++ b/ppocr/utils/ic15_dict.txt
@@ -34,3 +34,30 @@ w
 x
 y
 z
+A
+B
+C
+D
+E
+F
+G
+H
+I
+J
+K
+L
+M
+N
+O
+P
+Q
+R
+S
+T
+U
+V
+W
+X
+Y
+Z
--- a/ppocr/utils/japan_dict.txt
+++ b/ppocr/utils/japan_dict.txt
--- a/ppocr/utils/korean_dict.txt
+++ b/ppocr/utils/korean_dict.txt
+저
+자
+명
+:
+신
+효
+필
+<
+국
+문
+초
+록
+2
+5
+한
+어
+관
+계
+구
+의
+통
+사
+와
+미
+조
+-
+합
+법
+적
+접
+근
+본
+논
+은
+형
+성
+일
+종
+으
+로
+오
+래
+전
+부
+터
+되
+온
+인
+특
+을
+살
+피
+고
+다
+시
+이
+를
+정
+보
+기
+반
+머
+리
+중
+심
+하
+여
+가
+상
+호
+작
+용
+는
+모
+안
+에
+서
+련
+된
+러
+현
+들
+술
+해
+것
+목
+표
+삼
+론
+과
+두
+함
+께
+복
+면
+더
+나
+아
+화
+황
+까
+지
+요
+측
+므
+재
+느
+른
+및
+포
+괄
+할
+수
+있
+잘
+착
+장
+뒤
+식
+절
+차
+위
+범
+주
+그
+유
+6
+3
+동
+격
+설
+징
+찰
+존
+9
+라
+분
+류
+양
+였
+출
+발
+개
+념
+공
+백
+대
+귀
+등
+펴
+략
+연
+도
+울
+핀
+많
+영
+역
+니
+제
+능
+내
+만
+충
+첨
+점
+핵
+'
+않
+높
+체
+낮
+섬
+약
+드
+난
+또
+순
+진
+언
+타
+소
+편
+르
+데
+7
+별
+립
+야
+외
+밀
+맺
+방
+속
+행
+배
+경
+건
+려
+운
+원
+따
+후
+규
+짓
+바
+탕
+우
+선
+달
+활
+질
+채
+택
+임
+단
+히
+벗
+될
+색
+았
+간
+극
+루
+세
+파
+악
+게
+1
+말
+었
+집
+생
+입
+밝
+혀
+졌
+맥
+락
+쪽
+왔
+검
+토
+던
+확
+새
+란
+음
+치
+마
+못
+했
+맞
+춘
+며
+급
+거
+석
+남
+8
+누
+든
+완
+갖
+추
+앞
+쓰
+익
+섭
+홍
+빈
+같
+눈
+{
+0
+런
+낸
+열
+람
+네
+떤
+렵
+때
+닌
+}
+학
+당
+혼
+준
+즉
+불
+없
+취
+비
+강
+변
+결
+렇
+겨
+키
+무
+받
+4
+항
+흔
+처
+직
+뿌
+엄
+축
+휘
+담
+컴
+퓨
+향
+몇
+둔
+박
+병
+참
+잡
+율
+금
+긴
+태
+각
+값
+렬
+예
+
+|
+[
+]
+큰
+갈
+칙
+됨
+산
+매
+크
+증
+막
+뿐
+럼
+청
+층
+롯
+랜
+떻
+독
+력
+응
+감
+틀
+롭
+낼
+최
+희
+돈
+겹
+친
+쉽
+삭
+킨
+놓
+실
+"
+폭
+넓
+료
+허
+메
+교
+*
+ㄴ
+붙
+스
+싸
+환
+찬
+=
+흐
+름
+물
+켰
+뀌
+삽
+#
+첫
+번
+째
+억
+너
+멀
+떨
+져
+밑
+줄
+냥
+움
+볼
+둘
+깊
+탈
+낳
+왜
+벽
+족
+책
+읽
+겠
+찾
+큼
+투
+곳
+판
+끼
+철
+쉬
+칭
+;
+견
+빠
+섯
+린
+습
+흥
+객
+묘
+꼴
+쉼
+쓸
+끝
+올
+령
+풀
+?
+몰
+냐
+년
+권
+씩
+길
+밖
+알
+떠
+옆
+슷
+룬
+윤
+_
+랑
+났
+침
+먹
+찌
+꺼
+곰
+죽
+풍
+탄
+냄
+듯
+엇
+꾼
+회
+트
+날
+빼
+닐
+승
+맏
+딸
+버
+>
+켜
+덕
+총
+꾸
+ㄹ
+혹
+김
+균
+밥
+폐
+쇄
+평
+깝
+쉘
+옛
+\
+품
+ㄸ
+얻
+돌
+셨
+킬
+득
+뜻
+갔
+봉
+넘
+뺏
+민
+워
+렸
+써
+림
+찍
+척
+잃
+답
+앗
+널
+송
+혜
+얼
+천
+셈
+녀
+골
+옮
+겼
+씨
+놀
+좌
+쳐
+좁
+님
+옷
+멋
+업
+월
+디
+늘
+창
+닭
+랐
+봄
+손
+왼
+코
+끌
+잉
+펄
+뛰
+낚
+對
+象
+化
+훈
+퍽
+쌍
+몸
+쯤
+걸
+!
+쓴
+샀
+노
+좋
+컬
+쥐
+쫓
+혔
+잠
+깐
+좀
+깨
+웠
+군
+찔
+렀
+딕
+암
+룰
+맛
+카
+훨
+씬
+꼭
+럽
+촘
+광
+눌
+뒷
+팔
+망
+꺾
+먼
+뀐
+짐
+넣
+짜
+킴
+슴
+슨
+걷
+뉜
+`
+숙
+글
+例
+同
+名
+異
+人
+럿
+퍼
+뜨
+험
+북
+끄
+짝
+칼
+닮
+짧
+쁜
+앉
+춥
+픈
+밉
+프
+둥
+싫
+애
+힌
+깎
+융
+앤
+똑
+깥
+껴
+싼
+잊
+낡
+봐
+욱
+케
+커
+곤
+낌
+헐
+긋
+테
+&
+윈
+닥
+슬
+셋
+맨
+럴
+흡
+홀
+잖
+힘
+닫
+뮤
+션
+칠
+쉐
+량
+획
+혁
+협
+웨
+샹
+즘
+쏟
+쟁
+컨
+띠
+례
+플
+농
+낙
+탐
+육
+뇌
+팽
+궁
+늦
+춰
+탁
+패
+긍
+텔
+레
+젼
+뉴
+高
+빨
+퇴
+맡
+컫
+욕
+곽
+염
+~
+팩
+베
+곧
+職
+뚜
+렷
+닦
+겪
+냉
+헌
+죄
+쳤
+젊
+엘
+냈
+맑
+쿠
+푸
+믿
+뎨
+웬
+멸
+츠
+끊
+윌
+릴
+밟
+브
+삶
+끔
+률
+깃
+듦
+딘
+램
+펀
+웅
+훗
+콜
+촉
+즈
+벨
+꾀
+궤
+펜
+쿨
+뢰
+톤
+륙
+젝
+젠
+딪
+묵
+됐
+곡
+빚
+템
+父
+系
+權
+혈
+첩
+압
+괴
+숭
+뽑
+숨
+벼
+즐
+쾌
+륜
+三
+從
+之
+道
+七
+去
+惡
+잔
+쉴
+낱
+흉
+낀
+얽
+납
+볍
+헤
+촌
+뻗
+%
+뭐
+홉
+떼
+뻔
+쨌
+걱
+쌓
+튼
+썩
+덮
+굴
+엮
+곁
+델
+쯧
+갑
+괜
+찮
+땅
+랫
+얌
+왠
+껏
+녕
+쑥
+섞
+렴
+풋
+뗀
+벌
+얘
+닉
+횟
+클
+컸
+밤
+싶
+겉
+푼
+꼈
+릇
+쩍
+녁
+쩌
+멈
+눕
+겁
+듣
+낭
+얇
+꿈
+틴
+엷
+젓
+귄
+굉
+옳
+몹
+뚫
+떡
+죠
+훌
+륭
+앓
+팬
+티
+액
+묻
+흘
+텃
+밭
+핏
+엔
+쇠
+페
+댔
+톱
+깍
+땠
+땐
+툭
+멍
+붉
+빛
+띤
+쭐
+댄
+숱
+샤
+툰
+줍
+윽
+딱
+솔
+뭔
+뜬
+덥
+덜
+뜩
+줌
+떳
+십
+팼
+쌀
+꼬
+듬
+꼽
+쁘
+꿔
+몫
+쁨
+엽
+셔
+헛
+꽤
+툴
+숲
+덤
+엿
+쏘
+낄
+팠
+色
+톨
+릭
+랄
+섹
+훑
+띄
+돼
+봤
+홧
+끗
+룻
+到
+達
+度
+推
+論
+變
+革
+樸
+根
+低
+作
+爲
+個
+原
+點
+밈
+賢
+明
+둑
+偏
+見
+者
+룩
+文
+質
+心
+身
+富
+利
+華
+美
+僞
+巧
+困
+惑
+飾
+無
+極
+仁
+萬
+物
+짚
+草
+犬
+不
+而
+不
+魏
+晋
+時
+代
+왕
+王
+弼
+開
+券
+常
+差
+別
+相
+一
+般
+窮
+稱
+大
+言
+辭
+當
+體
+實
+德
+上
+日
+證
+市
+씌
+老
+子
+秦
+漢
+源
+流
+生
+沒
+年
+宇
+宙
+著
+假
+託
+集
+積
+빗
+透
+徹
+前
+中
+期
+司
+馬
+遷
+史
+記
+韓
+非
+列
+傳
+學
+問
+經
+書
+諸
+百
+家
+儒
+思
+想
+武
+帝
+董
+仲
+舒
+朝
+國
+敎
+的
+官
+典
+訓
+枯
+風
+始
+皇
+갱
+焚
+坑
+紀
+獻
+先
+濟
+南
+伏
+故
+老
+新
+今
+舊
+古
+尙
+텍
+룹
+뉘
+易
+五
+專
+門
+墨
+守
+數
+融
+鄭
+玄
+章
+建
+初
+白
+虎
+觀
+議
+奏
+通
+義
+誥
+周
+禮
+儀
+禮
+春
+秋
+鞏
+羊
+穀
+梁
+佐
+氏
+論
+語
+班
+固
+筍
+悅
+凞
+衡
+太
+談
+憤
+滿
+公
+自
+序
+宣
+室
+令
+天
+星
+歷
+卜
+祝
+丞
+曆
+揚
+何
+黃
+元
+封
+泰
+山
+禪
+地
+治
+平
+閣
+딜
+河
+洛
+虞
+夏
+死
+西
+方
+關
+잇
+操
+縱
+發
+千
+歲
+海
+內
+紬
+君
+士
+載
+修
+事
+業
+淡
+六
+陰
+陽
+刑
+致
+廬
+歸
+法
+省
+下
+本
+四
+季
+多
+面
+臣
+夫
+婦
+長
+幼
+꿀
+節
+儉
+形
+善
+俗
+主
+旨
+功
+述
+点
+短
+卓
+說
+굳
+然
+久
+合
+虛
+聖
+텅
+因
+行
+端
+寬
+正
+肖
+是
+政
+渾
+冥
+統
+循
+消
+綱
+龍
+陝
+城
+縣
+楊
+祖
+來
+蹟
+郎
+小
+聞
+石
+遺
+抽
+出
+룡
+李
+龍
+禍
+匈
+奴
+宮
+옥
+갇
+廣
+卷
+찢
+腸
+땀
+젖
+끓
+任
+安
+悲
+境
+詩
+簡
+略
+屈
+離
+騷
+左
+丘
+意
+鬱
+結
+惟
+逝
+涇
+壺
+遂
+表
+理
+혐
+世
+再
+興
+徑
+川
+溪
+谷
+禽
+獸
+木
+牝
+牡
+雌
+雄
+樂
+和
+잣
+指
+散
+侯
+奔
+走
+里
+照
+夕
+ㄷ
+웃
+纂
+弑
+孝
+롤
+빙
+轉
+寫
+版
+註
+釋
+戰
+術
+脚
+맹
+唐
+解
+貞
+索
+隱
+張
+北
+宋
+遽
+뻐
+刊
+校
+訂
+耳
+伯
+뼈
+車
+流
+哲
+愚
+俠
+氣
+得
+雲
+尹
+喜
+萊
+用
+宗
+段
+干
+住
+骸
+앙
+膠
+仰
+傅
+淸
+淨
+口
+譯
+聃
+欄
+外
+交
+所
+在
+鄕
+曲
+膽
+函
+後
+邊
+韶
+銘
+曾
+陳
+敍
+倫
+몽
+蒙
+申
+害
+京
+궐
+闕
+沛
+捌
+志
+廟
+녹
+읍
+鹿
+邑
+江
+펼
+擔
+刻
+疑
+梁
+玉
+繩
+讀
+雜
+念
+孫
+왈
+諡
+曰
+字
+選
+楚
+桓
+덧
+幽
+尼
+曼
+귓
+福
+哀
+齒
+敬
+案
+與
+判
+二
+藝
+畢
+沅
+駒
+禦
+寇
+商
+弟
+嚴
+憺
+音
+澹
+蟬
+欌
+遊
+性
+魯
+叔
+랍
+貴
+辯
+舌
+칫
+執
+峻
+烈
+近
+閻
+若
+據
+昭
+續
+葬
+巷
+黨
+食
+곱
+喪
+孔
+十
+有
+葉
+適
+識
+寓
+崔
+東
+壁
+洙
+泗
+考
+信
+錄
+戴
+朱
+핑
+尊
+崇
+堯
+舜
+設
+類
+驕
+浴
+態
+淫
+盛
+我
+引
+存
+眞
+路
+庫
+굽
+欲
+禹
+立
+篇
+神
+仙
+應
+注
+哮
+景
+吳
+誅
+殺
+資
+鑑
+威
+定
+壽
+箱
+養
+쳇
+퀴
+씻
+私
+贍
+足
+移
+各
+博
+句
+韻
+陶
+冶
+탠
+核
+連
+智
+壯
+荀
+呂
+管
+愼
+策
+鬼
+喩
+末
+乾
+괘
+卦
+告
+界
+藩
+屛
+器
+第
+莫
+終
+也
+比
+庇
+役
+可
+線
+造
+츰
+切
+部
+偈
+頌
+벳
+要
+誦
+曜
+끈
+읊
+씀
+劫
+뾰
+틈
+妄
+챙
+뛸
+샘
+늪
+솟
+늙
+쭙
+苦
+솜
+삐
+꽃
+흩
+맙
+붓
+픔
+빌
+겸
+돋
+뽐
+팁
+돕
+흙
+랴
+坐
+뱀
+뿔
+숫
+댐
+읜
+짊
+깔
+듭
+ㄱ
+엉
+붕
+넌
+貪
+瞋
+痔
+脫
+밴
+엎
+큽
+덩
+읠
+姓
+階
+級
+힐
+콩
+묶
+훔
+肉
+넷
+뇨
+갚
+흑
+꽁
+휴
+껌
+씹
+뱉
+랬
+九
+涅
+槃
+入
+廷
+空
+惺
+具
+以
+둠
+求
+菩
+衆
+果
+벅
+짖
+센
+꼼
+똥
+뜸
+믐
+뜯
+털
+낯
+넬
+ㅎ
+늑
+캐
+큐
+렌
+텐
+쿵
+흠
+핌
+탓
+턱
+뚤
+멕
+켈
+졸
+쪼
+ㅂ
+앳
+탬
+즙
+휩
+폴
+뭉
+뚱
+빅
+슈
+셀
+둬
+캉
+튜
+ㅅ
+뭇
+얗
+핍
+썼
+場
+뀔
+숴
+像
+띨
+科
+屬
+種
+괸
+롱
+띈
+횡
+킹
+웰
+닷
+얕
+탱
+팡
+꿨
+펌
+헨
+콰
+링
+벤
+콘
+빔
+둡
+뚝
+헬
+콥
+펠
+쏠
+잦
+탑
+멩
+튀
+뽀
+돔
+꽝
+돗
+빽
+펭
+ㅇ
+짹
+렁
+옴
+껍
+옇
+윙
+햇
+닿
+얀
+흰
+윗
+굶
+둣
+깰
+맴
+뺨
+컷
+탔
+렐
+덟
+팥
+맘
+썰
+샌
+닝
+갯
+쩔
+캬
+춤
+릉
+싱
+캔
+깡
+킷
+뎠
+랭
+릎
+꽉
+첸
+췬
+랩
+옹
+뛴
+쐐
+믹
+찝
+댓
+걀
+쌘
+쉰
+갓
+틱
+폈
+냘
+랗
+늬
+빤
+톰
+맣
+/
+촬
+럭
+깬
+깜
+튕
+틋
+떴
+藻
+類
+잎
+셉
+싹
+캤
+훼
+틔
+놨
+얹
+젯
+캄
+師
+迦
+葉
+쯔
+붐
+僧
+茶
+弓
+醫
+팀
+臨
+曹
+洞
+겐
+昧
+魔
+旋
+씽
+柱
+趙
+州
+껄
+촛
+臥
+딴
+呵
+笑
+護
+位
+ㅌ
+漸
+認
+都
+寺
+딛
+콤
+렉
+副
+聰
+持
+阿
+蜀
+佛
+育
+受
+蘊
+慧
+갠
+잿
+렝
+女
+뗑
+慈
+앎
+휼
+겅
+됩
+닙
+힙
+짠
+덴
+블
+맷
+重
+옵
+멜
+봅
+겔
+ㅈ
+칩
+렘
+뵈
+삯
+몬
+暑
+싣
+찜
+퉁
+겟
+놋
+創
+컹
+렛
+花
+紅
+엡
+巢
+能
+꼐
+롬
+팍
+섰
+봇
+툼
+폼
+슥
+팎
+舟
+돛
+닻
+뗏
+엣
+칸
+知
+延
+批
+評
+理
+賞
+享
+뤄
+味
+浦
+筆
+漫
+쌩
+엠
+쇼
+흄
+뮈
+왓
+審
+分
+過
+間
+렙
+틸
+뭘
+뮐
+얏
+밋
+헉
+밧
+콧
+듸
+뿜
+앵
+쨍
+쭉
+誤
+덱
+愛
+샅
+밍
+눔
+룸
+엥
+폄
+꿰
+룐
+냇
+쑤
+릿
+圖
+盆
+勢
+坊
+民
+局
+承
+喆
+橋
+土
+保
+水
+濯
+멱
+獵
+頭
+踏
+깅
+李
+岸
+强
+占
+排
+뺀
+渠
+껑
+暗
+力
+銀
+鑛
+鐘
+樓
+共
+涌
+則
+精
+秩
+樣
+式
+聲
+畏
+脈
+絡
+찡
+뜰
+픽
+엌
+誠
+母
+胎
+其
+盤
+伴
+侶
+加
+工
+反
+車
+洋
+輪
+廻
+禾
+乘
+動
+땡
+볕
+캠
+귈
+넉
+感
+視
+覺
+댁
+늠
+戶
+棟
+뷰
+費
+얄
+廳
+往
+倍
+格
+斜
+젤
+客
+顚
+倒
+此
+彼
+步
+릅
+낫
+未
+靴
+샐
+핸
+켤
+줘
+톡
+맬
+넨
+巫
+슭
+兀
+瓦
+骨
+斯
+盟
+劃
+麗
+쿄
+뭍
+辰
+成
+族
+塞
+赤
+峰
+녔
+昔
+波
+角
+杯
+製
+꽂
+헝
+겊
+솥
+銅
+鏡
+줏
+鳥
+社
+陵
+處
+텡
+堆
+秘
+悖
+兒
+罕
+짙
+꿩
+쥬
+酒
+俱
+뭄
+홱
+靑
+鷹
+앴
+뽈
+튿
+卍
+騫
+域
+樺
+漁
+쟉
+八
+寶
+雙
+紋
+싯
+쩐
+욤
+丹
+뒬
+槍
+츨
+뱅
+泡
+疹
+哨
+눠
+톈
+샴
+캘
+쏜
+셰
+켯
+毛
+ㅓ
+斷
+層
+푹
+숀
+멧
+鰐
+梨
+늄
+遍
+超
+턴
+옐
+쿼
+랙
+球
+슘
+뷔
+퐁
+윅
+벙
+멘
+産
+줬
+콕
+팅
+잽
+닛
+쌉
+텁
+헙
+乎
+옭
+派
+띌
+꾹
+遠
+챌
+썽
+씁
+훤
+칵
+곬
+딩
+團
+連
+삿
+갸
+잭
+뗄
+쥔
+光
+庭
+漆
+옻
+닯
+寄
+回
+羽
+狀
+複
+燁
+樗
+樹
+땔
+綠
+雖
+危
+最
+好
+啼
+影
+侵
+綠
+衣
+濕
+夢
+賣
+臨
+魚
+月
+軒
+菜
+妊
+雪
+深
+夜
+愁
+귤
+펑
+柑
+橘
+亞
+金
+쌌
+橄
+攬
+欖
+薺
+멎
+腋
+媒
+鹽
+藏
+油
+쐬
+쪄
+桑
+童
+奇
+짇
+뽕
+供
+犧
+섣
+냅
+굵
+찧
+蓮
+詵
+巖
+液
+藥
+盧
+命
+賦
+髮
+香
+囊
+燕
+楓
+歌
+謠
+永
+金
+澤
+霜
+뫼
+勸
+뻑
+굿
+雀
+配
+糖
+松
+障
+幹
+궂
+홈
+꿋
+꺽
+雅
+苕
+云
+矣
+憂
+維
+傷
+如
+웁
+칡
+凌
+女
+紫
+墜
+瘀
+血
+乳
+蔡
+絹
+蠶
+繭
+紙
+蘭
+亭
+竹
+麻
+房
+友
+謝
+箋
+燈
+堂
+薛
+濤
+杜
+甫
+苔
+楮
+蘚
+植
+넋
+錦
+썹
+病
+빳
+阪
+組
+柳
+쬐
+又
+會
+놈
+밸
+홋
+島
+岡
+덫
+폰
+놔
+췄
+찐
+켓
+켄
+텄
+野
+村
+뻘
+쌈
+큘
+쨋
+콱
+座
+쥘
+田
+登
+井
+兵
+鬪
+멤
+黑
+넸
+由
+쳔
+軍
+情
+뿍
+댕
+技
+쩡
+貫
+ㅋ
+탤
+偶
+앰
+뷸
+핫
+郞
+店
+햄
+牛
+찼
+넛
+宅
+便
+急
+渡
+播
+磨
+齋
+藤
+忠
+次
+긁
+林
+晴
+띔
+낵
+吉
+祥
+짭
+짤
+隆
+勝
+茂
+務
+펫
+森
+良
+靖
+팸
+玲
+헹
+굼
+쉭
+륵
+쏙
+磁
+火
+印
+핥
+볐
+뎌
+現
+顯
+딤
+궈
+켠
+恨
+늉
+캇
+롸
+쎄
+헴
+誕
+탯
+夷
+낟
+殷
+슐
+燧
+農
+頊
+괭
+빻
+墟
+湯
+傑
+后
+稷
+戎
+越
+晉
+翟
+셜
+엊
+誌
+利
+賓
+盡
+把
+習
+全
+於
+챠
+뱍
+즌
+셍
+園
+츄
+墳
+엑
+雇
+岳
+퓬
+蕓
+촨
+뻬
+虹
+豫
+蔬
+杭
+蘇
+桂
+林
+秀
+璃
+臺
+潭
+烈
+輸
+特
+區
+鳳
+榮
+池
+魯
+蓮
+溫
+泉
+슝
+膨
+湖
+墾
+丁
+恒
+췌
+進
+옌
+텨
+냔
+ㅊ
+팜
+提
+羅
+弘
+益
+輯
+鄒
+牟
+奄
+넜
+랏
+留
+樂
+뼘
+曉
+잤
+諍
+薩
+柏
+逐
+鹿
+惠
+施
+꿴
+댈
+弱
+隨
+뱃
+汎
+兼
+支
+離
+損
+깻
+뭣
+鵲
+醯
+診
+臟
+뭡
+紂
+己
+抱
+烙
+樓
+쿡
+卿
+竅
+箕
+微
+祭
+康
+桀
+右
+땜
+逆
+滑
+釐
+攻
+煬
+辨
+拇
+枝
+目
+刺
+繡
+律
+律
+姑
+磬
+呂
+曠
+蔘
+輿
+衛
+靈
+堅
+居
+畸
+鳧
+脛
+鶴
+앨
+켐
+品
+少
+六
+孤
+齊
+首
+雷
+懸
+財
+貨
+눴
+챈
+參
+鰍
+臾
+盜
+拓
+麗
+縷
+躬
+穆
+調
+放
+至
+泊
+伐
+慾
+素
+朴
+樽
+珪
+璋
+쁠
+赫
+胥
+腹
+醴
+屋
+閭
+壬
+罰
+逢
+諫
+靈
+劣
+伍
+暈
+戮
+勇
+脣
+竭
+寒
+亡
+鄲
+薄
+圍
+起
+淵
+斗
+斛
+璽
+候
+爵
+恩
+斧
+鉞
+示
+絶
+乃
+止
+珠
+芋
+瑟
+琴
+僥
+匠
+拙
+妙
+容
+央
+栗
+陸
+畜
+轅
+盧
+炎
+曦
+跡
+짱
+좽
+沼
+莊
+彿
+舍
+塔
+婆
+摩
+벵
+若
+密
+蜜
+펙
+群
+剛
+趣
+改
+盂
+蘭
+鎭
+卽
+屍
+눗
+컵
+緣
+謙
+姚
+祇
+坵
+秤
+胡
+忍
+鈍
+梵
+뇩
+먁
+等
+直
+幻
+捨
+男
+願
+陸
+默
+寂
+甘
+露
+抄
+他
+肇
+菴
+뵙
+閔
+累
+皆
+奉
+講
+邪
+$
+芳
+듀
+갬
+맵
+뎀
+値
+稼
+價
+輕
+際
+갭
+網
+靜
+依
+互
+癖
+鈴
+蕉
+俳
+滅
+件
+퀘
+話
+皮
+電
+荷
+活
+降
+台
+佈
+彌
+陀
+疏
+唯
+攝
+燮
+跋
+親
+普
+叉
+難
+堤
+順
+儼
+澄
+苑
+昌
+院
+奈
+孺
+蘆
+絲
+茶
+趨
+伊
+列
+災
+厄
+英
+運
+歐
+參
+岩
+倉
+攘
+幕
+府
+潑
+殖
+猩
+條
+約
+諭
+沖
+峽
+休
+培
+艦
+馨
+防
+督
+弁
+桎
+梏
+征
+峙
+쵸
+兆
+梓
+朋
+隣
+搗
+嘗
+薪
+栗
+遼
+半
+沿
+灣
+立
+圈
+瓜
+恐
+熱
+醉
+綸
+答
+豪
+紳
+岐
+菫
+津
+袁
+凱
+純
+鐵
+洲
+企
+針
+隊
+瀋
+暘
+總
+領
+亥
+緖
+丸
+助
+敗
+猥
+獨
+望
+隷
+厦
+澳
+澎
+制
+祺
+瑞
+萍
+毅
+閥
+打
+破
+졍
+웹
+뙤
+튄
+쾰
+쏭
+뤼
+짰
+뭏
+看
+譜
+갛
+첼
+벡
+똘
+뺄
+잴
+잰
+偉
+勳
+寃
+掌
+布
+接
+亨
+甑
+姜
+淳
+報
+彬
+鼎
+奎
+倫
+訣
+吐
+蕃
+帽
+殿
+遡
+橡
+還
+領
+綽
+顔
+譚
+稽
+瑪
+壇
+彛
+꿇
+숯
+ㅆ
+녘
+來
+裕
+唱
+媚
+繪
+畵
+崖
+羅
+服
+料
+圓
+煌
+冠
+ㅣ
+船
+傾
+耕
+伎
+샬
+妖
+閃
+쩨
+몄
+맸
+晶
+ㅜ
+矢
+쓱
+髓
+뺑
+鷄
+揭
+巨
+龜
+햐
+딧
+拜
+겡
+眼
+緯
+契
+鮮
+卑
+落
+蒿
+准
+黎
+댑
+깟
+빕
+툇
+춧
+뼉
+킵
+깼
+숟
+뭅
+낏
+섶
+뱁
+돝
+杖
+왱
+삵
+갉
+烏
+飛
+梨
+뒹
+쇳
+홰
+짢
+擧
+兩
+뺐
+펐
+쩜
+홑
+윳
+允
+좇
+쇤
+룽
+챘
+흣
+裔
+엾
+뒀
+갗
+묽
+넙
+꼿
+뻤
+꿍
+컥
+뎅
+겋
+뢸
+쏴
+쭈
+쾅
+혓
+겻
+쫀
+뗐
+蝕
+臆
+荇
+∼
+쾡
+얍
+곶
+닳
+꿎
+켕
+캥
+탉
+곯
+짬
+뻣
+믈
+빡
+겄
+갤
+횃
+卒
+륨
+껐
+캡
+肥
+빴
+훅
+材
+翁
+뗍
+枰
+慣
+틉
+켭
+탭
+끽
+웜
+넝
+賊
+均
+米
+稀
+炭
+빵
+찹
+胚
+芽
+멥
+볶
+”
+곪
+酸
+沙
+麥
+궜
+貧
+怡
+찻
+肝
+豆
+壓
+疫
+午
+郡
+拾
+療
+滯
+痛
+菊
+症
+崩
+蔓
+葛
+粉
+救
+荒
+떫
+灰
+茵
+癌
+毒
+基
+脂
+授
+機
+滋
+補
+腎
+汗
+疼
+暈
+飮
+랒
+桔
+梗
+肺
+咽
+喉
+痺
+拘
+杞
+’
+菌
+燐
+板
+埴
+壤
+甲
+椒
+썬
+徐
+帶
+咳
+粘
+軟
+裂
+片
+援
+洛
+卵
+抗
+腫
+瘍
+粥
+伸
+將
+趾
+孟
+茹
+瀝
+튤
+苞
+蒲
+쫙
+番
+蠻
+倭
+擘
+煎
+苛
+劑
+符
+檀
+禁
+忌
+蒜
+必
+須
+量
+薑
+咸
+早
+隋
+챗
+棗
+떰
+枾
+飢
+餓
+滄
+옅
+檎
+捿
+秉
+垢
+溶
+整
+焦
+脾
+擒
+栢
+鋼
+潤
+稗
+耐
+晩
+燥
+游
+燔
+珍
+蝶
+裙
+刀
+借
+料
+煮
+胞
+那
+쫄
+佃
+濁
+輻
+貝
+쥴
+丑
+灸
+脯
+脩
+熟
+輓
+鴨
+逵
+凉
+胃
+瘡
+蟲
+髥
+쫑
+蒸
+糞
+屎
+볏
+덖
+豚
+猪
+쌔
+蜂
+餘
+豊
+寅
+獵
+牌
+使
+停
+碍
+狗
+塚
+吠
+飯
+숍
+錢
+雨
+追
+慕
+碑
+폿
+뵐
+쪘
+핼
+깁
+밌
+쩝
+떱
+넥
+짼
+씸
+겆
+휙
+깽
+뜀
+숩
+끙
+젭
+됴
+팝
+앱
+딨
+걔
+꺄
+눅
+쒔
+戀
+吏
+녜
+旱
+뺌
+샜
+꽥
+뻥
+걘
+떵
+뀄
+왁
+菽
+댜
+訊
+戟
+置
+睡
+삘
+샛
+낍
+才
+낑
+퀸
+꼍
+쟤
+待
+寸
+뎃
+浮
+沈
+쑨
+塵
+奮
+惡
+쨀
+떽
+쟈
+貸
+씰
+쒀
+좍
+휭
+뱄
+얜
+썸
+텀
+껀
+곗
+휠
+숄
+괌
+퉜
+꿉
+벚
+샷
+뷴
+웸
+킥
+슛
+챔
+뤘
+셸
+팻
+텝
+퀵
+콸
+뮬
+튈
+윔
+젬
+뮌
+욜
+갰
+휑
+퀭
+퉈
+헷
+탰
+랠
+븐
+퓰
+픕
+끕
+삔
+띵
+뀝
+헥
+휜
+룃
+셌
+흽
+챕
+땝
+톳
+쟀
+띕
+졀
+쨉
+뱐
+윱
+햅
+띱
+꾜
+궝
+늅
+붇
+곕
+횝
+푭
+샙
+벱
+닢
+뀜
+솝
+뜁
+쿤
+듐
+펩
+旗
+手
+患
+凡
+膜
+失
+型
+優
+尿
+襄
+限
+婚
+股
+臼
+細
+織
+卵
+尿
+늡
+^
+헀
+á
+ň
+ó
+ž
+“
+ç
+ü
+í
+é
+ã
+튠
+ä
+ć
+ă
+ş
+땄
+넹
+ö
+Š
+ě
+ñ
+퀀
+å
+ř
+ý
+캅
+∇
+è
+퀼
+쳄
+헵
+ê
+ō
+ø
+뢴
+î
+쩄
+롹
+옙
+Č
+č
+샨
+Ș
+쾨
+듈
+벰
+ș
+팰
+셴
+쳉
+â
+욘
+ë
+퓸
+É
+먀
+쪾
+Ö
+팟
+禅
+퀄
+ß
+ę
+Ł
+ź
+ą
+ł
+Α
+û
+ā
+à
+튬
+Ž
+đ
+浅
+克
+Ä
+š
+넴
+×
+뉩
+쐈
+Ü
+Å
+ì
+왑
+힉
+휄
+ı
+ţ
+웡
+İ
+О
+с
+т
+р
+о
+в
+Г
+а
+л
+я
+샵
+ė
+ń
+Á
+딥
+ī
+ğ
+힝
+½
+Ç
+φ
+ż
+ô
+Ó
+λ
+웍
+Δ
+ò
+ū
+캣
+嶋
+淑
+α
+ニ
+カ
+ラ
+グ
+ア
+ン
+©
+챤
+ï
+ú
+Ş
+→
+죤
+æ
+펨
+²
+õ
+뇽
+쎈
+°
+펍
+Í
+콴
+ð
+첵
+Î
+넵
+ē
+쿰
+「
+」
--- a/tools/infer/utility.py
+++ b/tools/infer/utility.py
@@ -70,7 +70,7 @@ def parse_args():
        "--rec_char_dict_path",
        type=str,
        default="./ppocr/utils/ppocr_keys_v1.txt")
-    parser.add_argument("--use_space_char", type=bool, default=True)
+    parser.add_argument("--use_space_char", type=str2bool, default=True)
    # params for text classifier
    parser.add_argument("--use_angle_cls", type=str2bool, default=False)