Merge pull request #188 from PaddlePaddle/add_scope

Add scope for models

Merge pull request #188 from PaddlePaddle/add_scope
Add scope for models
aaf19f7e · Jason · GitHub · 19523861 · 597d7d7f · aaf19f7e
12 changed file
--- a/docs/paddlex_gui/download.md
+++ b/docs/paddlex_gui/download.md
@@ -25,4 +25,3 @@
  * **硬盘空间**：建议SSD剩余空间1T以上（非必须）  

 ***注：PaddleX在Windows及Mac OS系统只支持单卡模型。Windows系统暂不支持NCCL。***
-
--- a/docs/paddlex_gui/how_to_use.md
+++ b/docs/paddlex_gui/how_to_use.md
--- a/docs/tutorials/datasets.md
+++ b/docs/tutorials/datasets.md
--- a/docs/tutorials/deploy/upgrade_version.md
+++ b/docs/tutorials/deploy/upgrade_version.md
--- a/paddlex/cv/models/base.py
+++ b/paddlex/cv/models/base.py
@@ -73,6 +73,7 @@ class BaseAPI:
        self.status = 'Normal'
        # 已完成迭代轮数，为恢复训练时的起始轮数
        self.completed_epochs = 0
+        self.scope = fluid.global_scope()

    def _get_single_card_bs(self, batch_size):
        if batch_size % len(self.places) == 0:
@@ -84,6 +85,10 @@ class BaseAPI:
                                'place']))

    def build_program(self):
+        if hasattr(paddlex, 'model_built') and paddlex.model_built:
+            logging.error(
+                "Function model.train() only can be called once in your code.")
+        paddlex.model_built = True
        # 构建训练网络
        self.train_inputs, self.train_outputs = self.build_net(mode='train')
        self.train_prog = fluid.default_main_program()
@@ -155,7 +160,7 @@ class BaseAPI:
            outputs=self.test_outputs,
            batch_size=batch_size,
            batch_nums=batch_num,
-            scope=None,
+            scope=self.scope,
            algo='KL',
            quantizable_op_type=["conv2d", "depthwise_conv2d", "mul"],
            is_full_quantize=False,
@@ -244,8 +249,8 @@ class BaseAPI:
            logging.info(
                "Load pretrain weights from {}.".format(pretrain_weights),
                use_color=True)
-            paddlex.utils.utils.load_pretrain_weights(
-                self.exe, self.train_prog, pretrain_weights, fuse_bn)
+            paddlex.utils.utils.load_pretrain_weights(self.exe, self.train_prog,
+                                                      pretrain_weights, fuse_bn)
        # 进行裁剪
        if sensitivities_file is not None:
            import paddleslim
@@ -349,9 +354,7 @@ class BaseAPI:
        logging.info("Model saved in {}.".format(save_dir))

    def export_inference_model(self, save_dir):
-        test_input_names = [
-            var.name for var in list(self.test_inputs.values())
-        ]
+        test_input_names = [var.name for var in list(self.test_inputs.values())]
        test_outputs = list(self.test_outputs.values())
        if self.__class__.__name__ == 'MaskRCNN':
            from paddlex.utils.save import save_mask_inference_model
@@ -388,8 +391,7 @@ class BaseAPI:

        # 模型保存成功的标志
        open(osp.join(save_dir, '.success'), 'w').close()
-        logging.info("Model for inference deploy saved in {}.".format(
-            save_dir))
+        logging.info("Model for inference deploy saved in {}.".format(save_dir))

    def train_loop(self,
                   num_epochs,
@@ -513,12 +515,10 @@ class BaseAPI:
                        eta = ((num_epochs - i) * total_num_steps - step - 1
                               ) * avg_step_time
                    if time_eval_one_epoch is not None:
-                        eval_eta = (
-                            total_eval_times - i // save_interval_epochs
+                        eval_eta = (total_eval_times - i // save_interval_epochs
                                    ) * time_eval_one_epoch
                    else:
-                        eval_eta = (
-                            total_eval_times - i // save_interval_epochs
+                        eval_eta = (total_eval_times - i // save_interval_epochs
                                    ) * total_num_steps_eval * avg_step_time
                    eta_str = seconds_to_hms(eta + eval_eta)


--- a/paddlex/cv/models/classifier.py
+++ b/paddlex/cv/models/classifier.py
@@ -227,6 +227,7 @@ class BaseClassifier(BaseAPI):
        true_labels = list()
        pred_scores = list()
        if not hasattr(self, 'parallel_test_prog'):
+            with fluid.scope_guard(self.scope):
                self.parallel_test_prog = fluid.CompiledProgram(
                    self.test_prog).with_data_parallel(
                        share_vars_from=self.parallel_train_prog)
@@ -242,7 +243,9 @@ class BaseClassifier(BaseAPI):
                num_pad_samples = batch_size - num_samples
                pad_images = np.tile(images[0:1], (num_pad_samples, 1, 1, 1))
                images = np.concatenate([images, pad_images])
-            outputs = self.exe.run(self.parallel_test_prog,
+            with fluid.scope_guard(self.scope):
+                outputs = self.exe.run(
+                    self.parallel_test_prog,
                    feed={'image': images},
                    fetch_list=list(self.test_outputs.values()))
            outputs = [outputs[0][:num_samples]]
@@ -286,6 +289,7 @@ class BaseClassifier(BaseAPI):
            self.arrange_transforms(
                transforms=self.test_transforms, mode='test')
            im = self.test_transforms(img_file)
+        with fluid.scope_guard(self.scope):
            result = self.exe.run(self.test_prog,
                                  feed={'image': im},
                                  fetch_list=list(self.test_outputs.values()),

--- a/paddlex/cv/models/deeplabv3p.py
+++ b/paddlex/cv/models/deeplabv3p.py
@@ -317,19 +317,18 @@ class DeepLabv3p(BaseAPI):
            tuple (metrics, eval_details)：当return_details为True时，增加返回dict (eval_details)，
                包含关键字：'confusion_matrix'，表示评估的混淆矩阵。
        """
-        self.arrange_transforms(
-            transforms=eval_dataset.transforms, mode='eval')
+        self.arrange_transforms(transforms=eval_dataset.transforms, mode='eval')
        total_steps = math.ceil(eval_dataset.num_samples * 1.0 / batch_size)
        conf_mat = ConfusionMatrix(self.num_classes, streaming=True)
        data_generator = eval_dataset.generator(
            batch_size=batch_size, drop_last=False)
        if not hasattr(self, 'parallel_test_prog'):
+            with fluid.scope_guard(self.scope):
                self.parallel_test_prog = fluid.CompiledProgram(
                    self.test_prog).with_data_parallel(
                        share_vars_from=self.parallel_train_prog)
-        logging.info(
-            "Start to evaluating(total_samples={}, total_steps={})...".format(
-                eval_dataset.num_samples, total_steps))
+        logging.info("Start to evaluating(total_samples={}, total_steps={})...".
+                     format(eval_dataset.num_samples, total_steps))
        for step, data in tqdm.tqdm(
                enumerate(data_generator()), total=total_steps):
            images = np.array([d[0] for d in data])
@@ -350,7 +349,9 @@ class DeepLabv3p(BaseAPI):
                pad_images = np.tile(images[0:1], (num_pad_samples, 1, 1, 1))
                images = np.concatenate([images, pad_images])
            feed_data = {'image': images}
-            outputs = self.exe.run(self.parallel_test_prog,
+            with fluid.scope_guard(self.scope):
+                outputs = self.exe.run(
+                    self.parallel_test_prog,
                    feed=feed_data,
                    fetch_list=list(self.test_outputs.values()),
                    return_numpy=True)
@@ -399,6 +400,7 @@ class DeepLabv3p(BaseAPI):
                transforms=self.test_transforms, mode='test')
            im, im_info = self.test_transforms(im_file)
        im = np.expand_dims(im, axis=0)
+        with fluid.scope_guard(self.scope):
            result = self.exe.run(self.test_prog,
                                  feed={'image': im},
                                  fetch_list=list(self.test_outputs.values()),

--- a/paddlex/cv/models/faster_rcnn.py
+++ b/paddlex/cv/models/faster_rcnn.py
@@ -325,7 +325,9 @@ class FasterRCNN(BaseAPI):
                'im_info': im_infos,
                'im_shape': im_shapes,
            }
-            outputs = self.exe.run(self.test_prog,
+            with fluid.scope_guard(self.scope):
+                outputs = self.exe.run(
+                    self.test_prog,
                    feed=[feed_data],
                    fetch_list=list(self.test_outputs.values()),
                    return_numpy=False)
@@ -388,6 +390,7 @@ class FasterRCNN(BaseAPI):
        im = np.expand_dims(im, axis=0)
        im_resize_info = np.expand_dims(im_resize_info, axis=0)
        im_shape = np.expand_dims(im_shape, axis=0)
+        with fluid.scope_guard(self.scope):
            outputs = self.exe.run(self.test_prog,
                                   feed={
                                       'image': im,

--- a/paddlex/cv/models/load_model.py
+++ b/paddlex/cv/models/load_model.py
@@ -24,6 +24,7 @@ import paddlex.utils.logging as logging


 def load_model(model_dir, fixed_input_shape=None):
+    model_scope = fluid.Scope()
    if not osp.exists(osp.join(model_dir, "model.yml")):
        raise Exception("There's not model.yml in {}".format(model_dir))
    with open(osp.join(model_dir, "model.yml")) as f:
@@ -51,6 +52,7 @@ def load_model(model_dir, fixed_input_shape=None):
                             format(fixed_input_shape))
                model.fixed_input_shape = fixed_input_shape

+    with fluid.scope_guard(model_scope):
        if status == "Normal" or \
                status == "Prune" or status == "fluid.save":
            startup_prog = fluid.Program()
@@ -79,7 +81,8 @@ def load_model(model_dir, fixed_input_shape=None):
            model.test_inputs = OrderedDict()
            model.test_outputs = OrderedDict()
            for name in input_names:
-            model.test_inputs[name] = model.test_prog.global_block().var(name)
+                model.test_inputs[name] = model.test_prog.global_block().var(
+                    name)
            for i, out in enumerate(outputs):
                var_desc = test_outputs_info[i]
                model.test_outputs[var_desc[0]] = out
@@ -107,6 +110,7 @@ def load_model(model_dir, fixed_input_shape=None):
                model.__dict__[k] = v

    logging.info("Model[{}] loaded.".format(info['Model']))
+    model.scope = model_scope
    model.trainable = False
    model.status = status
    return model

--- a/paddlex/cv/models/mask_rcnn.py
+++ b/paddlex/cv/models/mask_rcnn.py
@@ -286,7 +286,9 @@ class MaskRCNN(FasterRCNN):
                'im_info': im_infos,
                'im_shape': im_shapes,
            }
-            outputs = self.exe.run(self.test_prog,
+            with fluid.scope_guard(self.scope):
+                outputs = self.exe.run(
+                    self.test_prog,
                    feed=[feed_data],
                    fetch_list=list(self.test_outputs.values()),
                    return_numpy=False)
@@ -356,6 +358,7 @@ class MaskRCNN(FasterRCNN):
        im = np.expand_dims(im, axis=0)
        im_resize_info = np.expand_dims(im_resize_info, axis=0)
        im_shape = np.expand_dims(im_shape, axis=0)
+        with fluid.scope_guard(self.scope):
            outputs = self.exe.run(self.test_prog,
                                   feed={
                                       'image': im,

--- a/paddlex/cv/models/slim/post_quantization.py
+++ b/paddlex/cv/models/slim/post_quantization.py
@@ -154,8 +154,8 @@ class PaddleXPostTrainingQuantization(PostTrainingQuantization):
        logging.info("Start to run batch!")
        for data in self._data_loader():
            start = time.time()
-            self._executor.run(
-                program=self._program,
+            with fluid.scope_guard(self._scope):
+                self._executor.run(program=self._program,
                                   feed=data,
                                   fetch_list=self._fetch_list,
                                   return_numpy=False)
@@ -164,10 +164,9 @@ class PaddleXPostTrainingQuantization(PostTrainingQuantization):
            else:
                self._sample_threshold()
            end = time.time()
-            logging.debug('[Run batch data] Batch={}/{}, time_each_batch={} s.'.format(
-                str(batch_id + 1),
-                str(batch_ct),
-                str(end-start)))
+            logging.debug(
+                '[Run batch data] Batch={}/{}, time_each_batch={} s.'.format(
+                    str(batch_id + 1), str(batch_ct), str(end - start)))
            batch_id += 1
            if self._batch_nums and batch_id >= self._batch_nums:
                break
@@ -194,6 +193,7 @@ class PaddleXPostTrainingQuantization(PostTrainingQuantization):
        Returns:
            None
        '''
+        with fluid.scope_guard(self._scope):
            feed_vars_names = [var.name for var in self._feed_list]
            fluid.io.save_inference_model(
                dirname=save_model_path,
@@ -212,7 +212,8 @@ class PaddleXPostTrainingQuantization(PostTrainingQuantization):
        self._data_loader = fluid.io.DataLoader.from_generator(
            feed_list=feed_vars, capacity=3 * self._batch_size, iterable=True)
        self._data_loader.set_sample_list_generator(
-            self._dataset.generator(self._batch_size, drop_last=True),
+            self._dataset.generator(
+                self._batch_size, drop_last=True),
            places=self._place)

    def _calculate_kl_threshold(self):
@@ -235,10 +236,12 @@ class PaddleXPostTrainingQuantization(PostTrainingQuantization):
                    weight_threshold.append(abs_max_value)
            self._quantized_var_kl_threshold[var_name] = weight_threshold
            end = time.time()
-            logging.debug('[Calculate weight] Weight_id={}/{}, time_each_weight={} s.'.format(
+            logging.debug(
+                '[Calculate weight] Weight_id={}/{}, time_each_weight={} s.'.
+                format(
                    str(ct),
-                str(len(self._quantized_weight_var_name)),
-                str(end-start)))
+                    str(len(self._quantized_weight_var_name)), str(end -
+                                                                   start)))
            ct += 1

        ct = 1
@@ -257,10 +260,12 @@ class PaddleXPostTrainingQuantization(PostTrainingQuantization):
                self._quantized_var_kl_threshold[var_name] = \
                    self._get_kl_scaling_factor(np.abs(sampling_data))
                end = time.time()
-                logging.debug('[Calculate activation] Activation_id={}/{}, time_each_activation={} s.'.format(
+                logging.debug(
+                    '[Calculate activation] Activation_id={}/{}, time_each_activation={} s.'.
+                    format(
                        str(ct),
                        str(len(self._quantized_act_var_name)),
-                    str(end-start)))
+                        str(end - start)))
                ct += 1
        else:
            for var_name in self._quantized_act_var_name:
@@ -270,10 +275,10 @@ class PaddleXPostTrainingQuantization(PostTrainingQuantization):
                self._quantized_var_kl_threshold[var_name] = \
                    self._get_kl_scaling_factor(np.abs(self._sampling_data[var_name]))
                end = time.time()
-                logging.debug('[Calculate activation] Activation_id={}/{}, time_each_activation={} s.'.format(
+                logging.debug(
+                    '[Calculate activation] Activation_id={}/{}, time_each_activation={} s.'.
+                    format(
                        str(ct),
                        str(len(self._quantized_act_var_name)),
-                    str(end-start)))
+                        str(end - start)))
                ct += 1
-
-                
\ No newline at end of file
--- a/paddlex/cv/models/yolo_v3.py
+++ b/paddlex/cv/models/yolo_v3.py
@@ -313,7 +313,9 @@ class YOLOv3(BaseAPI):
            images = np.array([d[0] for d in data])
            im_sizes = np.array([d[1] for d in data])
            feed_data = {'image': images, 'im_size': im_sizes}
-            outputs = self.exe.run(self.test_prog,
+            with fluid.scope_guard(self.scope):
+                outputs = self.exe.run(
+                    self.test_prog,
                    feed=[feed_data],
                    fetch_list=list(self.test_outputs.values()),
                    return_numpy=False)
@@ -366,6 +368,7 @@ class YOLOv3(BaseAPI):
            im, im_size = self.test_transforms(img_file)
        im = np.expand_dims(im, axis=0)
        im_size = np.expand_dims(im_size, axis=0)
+        with fluid.scope_guard(self.scope):
            outputs = self.exe.run(self.test_prog,
                                   feed={'image': im,
                                         'im_size': im_size},