update get_img_file_list

2025ed1d · tink2123 · 250cd37a · 2025ed1d · 2025ed1d
隐藏空白更改
内联并排

Showing with 23 addition and 22 deletion

ppocr/data/rec/dataset_traversal.py ppocr/data/rec/dataset_traversal.py +22 -21

tools/infer_rec.py tools/infer_rec.py +1 -1

未找到文件。
--- a/ppocr/data/rec/dataset_traversal.py
+++ b/ppocr/data/rec/dataset_traversal.py
@@ -22,7 +22,7 @@ import string
 import lmdb
 from ppocr.utils.utility import initial_logger
-from tools.infer.utility import get_image_file_list
+from ppocr.utils.utility import get_image_file_list
 logger = initial_logger()
 from .img_tools import process_image, get_img_data
@@ -173,26 +173,27 @@ class SimpleReader(object):
                        img = cv2.cvtColor(img, cv2.COLOR_GRAY2BGR)
                    norm_img = process_image(img, self.image_shape)
                    yield norm_img
-            with open(self.label_file_path, "rb") as fin:
+            else:
-                label_infor_list = fin.readlines()
+                with open(self.label_file_path, "rb") as fin:
-            img_num = len(label_infor_list)
+                    label_infor_list = fin.readlines()
-            img_id_list = list(range(img_num))
+                img_num = len(label_infor_list)
-            random.shuffle(img_id_list)
+                img_id_list = list(range(img_num))
-            for img_id in range(process_id, img_num, self.num_workers):
+                random.shuffle(img_id_list)
-                label_infor = label_infor_list[img_id_list[img_id]]
+                for img_id in range(process_id, img_num, self.num_workers):
-                substr = label_infor.decode('utf-8').strip("\n").split("\t")
+                    label_infor = label_infor_list[img_id_list[img_id]]
-                img_path = self.img_set_dir + "/" + substr[0]
+                    substr = label_infor.decode('utf-8').strip("\n").split("\t")
-                img = cv2.imread(img_path)
+                    img_path = self.img_set_dir + "/" + substr[0]
-                if img is None:
+                    img = cv2.imread(img_path)
-                    logger.info("{} does not exist!".format(img_path))
+                    if img is None:
-                    continue
+                        logger.info("{} does not exist!".format(img_path))
-                label = substr[1]
+                        continue
-                outs = process_image(img, self.image_shape, label,
+                    label = substr[1]
-                                     self.char_ops, self.loss_type,
+                    outs = process_image(img, self.image_shape, label,
-                                     self.max_text_length)
+                                         self.char_ops, self.loss_type,
-                if outs is None:
+                                         self.max_text_length)
-                    continue
+                    if outs is None:
-                yield outs
+                        continue
+                    yield outs
        def batch_iter_reader():
            batch_outs = []

--- a/tools/infer_rec.py
+++ b/tools/infer_rec.py
@@ -46,7 +46,7 @@ from ppocr.data.reader_main import reader_main
 from ppocr.utils.save_load import init_model
 from ppocr.utils.character import CharacterOps
 from ppocr.utils.utility import create_module
-from tools.infer.utility import get_image_file_list
+from ppocr.utils.utility import get_image_file_list
 logger = initial_logger()