fix

ca1c4695 · xjqbest · 07bd7092 · ca1c4695 · ca1c4695 · ca1c4695
6 changed file
--- a/core/reader.py
+++ b/core/reader.py
@@ -35,7 +35,6 @@ class Reader(dg.MultiSlotDataGenerator):
        else:
            raise ValueError("reader config only support yaml")
    @abc.abstractmethod
    def init(self):
        """init"""
@@ -56,8 +55,6 @@ class SlotReader(dg.MultiSlotDataGenerator):
                _config = yaml.load(rb.read(), Loader=yaml.FullLoader)
        else:
            raise ValueError("reader config only support yaml")
-        #envs.set_global_envs(_config)
-        #envs.update_workspace()
    def init(self, sparse_slots, dense_slots, padding=0):
        from operator import mul

--- a/core/trainers/single_trainer.py
+++ b/core/trainers/single_trainer.py
@@ -69,13 +69,14 @@ class SingleTrainer(TranspileTrainer):
        reader = os.path.join(abs_dir, '../utils', 'dataset_instance.py')
        if sparse_slots is None and dense_slots is None:
-            pipe_cmd = "python {} {} {} {}".format(reader, reader_class, "TRAIN", self._config_yaml)
+            pipe_cmd = "python {} {} {} {}".format(reader, reader_class,
+                                                   "TRAIN", self._config_yaml)
        else:
            if sparse_slots is None:
                sparse_slots = "#"
            if dense_slots is None:
                dense_slots = "#"
-            padding = envs.get_global_env(name +"padding", 0)
+            padding = envs.get_global_env(name + "padding", 0)
            pipe_cmd = "python {} {} {} {} {} {} {} {}".format(
                reader, "slot", "slot", self._config_yaml, "fake", \
                sparse_slots.replace(" ", "#"), dense_slots.replace(" ", "#"), str(padding))
@@ -145,19 +146,29 @@ class SingleTrainer(TranspileTrainer):
            scope = fluid.Scope()
            dataset_name = model_dict["dataset_name"]
            opt_name = envs.get_global_env("hyper_parameters.optimizer.class")
-            opt_lr = envs.get_global_env("hyper_parameters.optimizer.learning_rate")
+            opt_lr = envs.get_global_env(
-            opt_strategy = envs.get_global_env("hyper_parameters.optimizer.strategy")
+                "hyper_parameters.optimizer.learning_rate")
+            opt_strategy = envs.get_global_env(
+                "hyper_parameters.optimizer.strategy")
            with fluid.program_guard(train_program, startup_program):
                with fluid.unique_name.guard():
                    with fluid.scope_guard(scope):
-                        model_path = model_dict["model"].replace("{workspace}", envs.path_adapter(self._env["workspace"]))
+                        model_path = model_dict["model"].replace(
-                        model = envs.lazy_instance_by_fliename(model_path, "Model")(self._env)
+                            "{workspace}",
-                        model._data_var = model.input_data(dataset_name=model_dict["dataset_name"])
+                            envs.path_adapter(self._env["workspace"]))
-                        if envs.get_global_env("dataset." + dataset_name + ".type") == "DataLoader":
+                        model = envs.lazy_instance_by_fliename(
+                            model_path, "Model")(self._env)
+                        model._data_var = model.input_data(
+                            dataset_name=model_dict["dataset_name"])
+                        if envs.get_global_env("dataset." + dataset_name +
+                                               ".type") == "DataLoader":
                            model._init_dataloader()
-                            self._get_dataloader(dataset_name, model._data_loader)
+                            self._get_dataloader(dataset_name,
-                        model.net(model._data_var, is_infer=model_dict.get("is_infer", False))
+                                                 model._data_loader)
-                        optimizer = model._build_optimizer(opt_name, opt_lr, opt_strategy)
+                        model.net(model._data_var,
+                                  is_infer=model_dict.get("is_infer", False))
+                        optimizer = model._build_optimizer(opt_name, opt_lr,
+                                                           opt_strategy)
                        optimizer.minimize(model._cost)
            self._model[model_dict["name"]][0] = train_program
            self._model[model_dict["name"]][1] = startup_program
@@ -167,13 +178,14 @@ class SingleTrainer(TranspileTrainer):
        for dataset in self._env["dataset"]:
            if dataset["type"] != "DataLoader":
-                self._dataset[dataset["name"]] = self._create_dataset(dataset["name"]) 
+                self._dataset[dataset["name"]] = self._create_dataset(dataset[
+                    "name"]) 
        context['status'] = 'startup_pass'
    def startup(self, context):
        for model_dict in self._env["executor"]:
-            with fluid.scope_guard(self._model[model_dict["name"]][2]):            
+            with fluid.scope_guard(self._model[model_dict["name"]][2]):
                self._exe.run(self._model[model_dict["name"]][1])
        context['status'] = 'train_pass'
@@ -289,7 +301,8 @@ class SingleTrainer(TranspileTrainer):
            return epoch_id % epoch_interval == 0
        def save_inference_model():
-            save_interval = envs.get_global_env("epoch.save_inference_interval", -1)
+            save_interval = int(
+                envs.get_global_env("epoch.save_inference_interval", -1)
            if not need_save(epoch_id, save_interval, False):
                return
            feed_varnames = envs.get_global_env("epoch.save_inference_feed_varnames", None)
@@ -313,7 +326,8 @@ class SingleTrainer(TranspileTrainer):
                                              fetch_vars, self._exe)
        def save_persistables():
-            save_interval = int(envs.get_global_env("epoch.save_checkpoint_interval", -1))
+            save_interval = int(
+                envs.get_global_env("epoch.save_checkpoint_interval", -1))
            if not need_save(epoch_id, save_interval, False):
                return
            dirname = envs.get_global_env("epoch.save_checkpoint_path", None)

--- a/core/utils/dataloader_instance.py
+++ b/core/utils/dataloader_instance.py
@@ -19,6 +19,7 @@ from paddlerec.core.utils.envs import get_global_env
 from paddlerec.core.utils.envs import get_runtime_environ
 from paddlerec.core.reader import SlotReader
 def dataloader_by_name(readerclass, dataset_name, yaml_file):
    reader_class = lazy_instance_by_fliename(readerclass, "TrainReader")
    name = "dataset." + dataset_name + "."
@@ -30,9 +31,9 @@ def dataloader_by_name(readerclass, dataset_name, yaml_file):
        data_path = os.path.join(package_base, data_path.split("::")[1])
    files = [str(data_path) + "/%s" % x for x in os.listdir(data_path)]
    reader = reader_class(yaml_file)
    reader.init()
    def gen_reader():
        for file in files:
            with open(file, 'r') as f:
@@ -67,7 +68,6 @@ def slotdataloader_by_name(readerclass, dataset_name, yaml_file):
        data_path = os.path.join(package_base, data_path.split("::")[1])
    files = [str(data_path) + "/%s" % x for x in os.listdir(data_path)]
    sparse = get_global_env(name + "sparse_slots")
    dense = get_global_env(name + "dense_slots")
    padding = get_global_env(name + "padding", 0)
@@ -96,6 +96,7 @@ def slotdataloader_by_name(readerclass, dataset_name, yaml_file):
        return gen_batch_reader()
    return gen_reader
 def dataloader(readerclass, train, yaml_file):
    if train == "TRAIN":
        reader_name = "TrainReader"

--- a/core/utils/envs.py
+++ b/core/utils/envs.py
@@ -20,6 +20,7 @@ import sys
 global_envs = {}
 def flatten_environs(envs, separator="."):
    flatten_dict = {}
    assert isinstance(envs, dict)
@@ -81,6 +82,7 @@ def set_global_envs(envs):
    fatten_env_namespace([], envs)
 def get_global_env(env_name, default_value=None, namespace=None):
    """
    get os environment value

--- a/models/rank/dnn/model.py
+++ b/models/rank/dnn/model.py
@@ -27,9 +27,12 @@ class Model(ModelBase):
    def _init_hyper_parameters(self):
        self.is_distributed = True if envs.get_trainer(
        ) == "CtrTrainer" else False
-        self.sparse_feature_number = envs.get_global_env("hyper_parameters.sparse_feature_number")
+        self.sparse_feature_number = envs.get_global_env(
-        self.sparse_feature_dim = envs.get_global_env("hyper_parameters.sparse_feature_dim")
+            "hyper_parameters.sparse_feature_number")
-        self.learning_rate = envs.get_global_env("hyper_parameters.learning_rate")
+        self.sparse_feature_dim = envs.get_global_env(
+            "hyper_parameters.sparse_feature_dim")
+        self.learning_rate = envs.get_global_env(
+            "hyper_parameters.learning_rate")
    def net(self, input, is_infer=False):
        self.sparse_inputs = self._sparse_data_var[1:]

--- a/run.py
+++ b/run.py
@@ -68,10 +68,8 @@ def get_engine(args):
    if engine is None:
        engine = run_extras.get("epoch.trainer_class", None)
    if engine is None:
-        engine = "single"
+        engine = "single" 
    engine = engine.upper()
    if engine not in engine_choices:
        raise ValueError("train.engin can not be chosen in {}".format(
            engine_choices))
@@ -135,6 +133,7 @@ def single_engine(args):
    trainer = TrainerFactory.create(args.model)
    return trainer
 def cluster_engine(args):
    def update_workspace(cluster_envs):
        workspace = cluster_envs.get("engine_workspace", None)