code fix

af3dad94 · tangwei · 47720eac · af3dad94 · af3dad94 · af3dad94
6 changed file
--- a/fleetrec/models/base.py
+++ b/fleetrec/models/base.py
@@ -85,7 +85,7 @@ class Model(object):
        self._cost = None
        self._metrics = {}
        self._data_var = []
-        pass
+        self._fetch_interval = 10

    def get_cost_op(self):
        """R
@@ -97,6 +97,9 @@ class Model(object):
        """
        return self._metrics

+    def get_fetch_period(self):
+        return self._fetch_interval
+
    @abc.abstractmethod
    def shrink(self, params):
        """R
@@ -169,6 +172,7 @@ class Model(object):
 class YamlModel(Model):
    """R
    """
+
    def __init__(self, config):
        """R
        """
@@ -218,7 +222,7 @@ class YamlModel(Model):
                            inference_param = extend_output['inference_param']
                            param_name = inference_param['name']
                            if param_name not in self._build_param['table']:
-                                self._build_param['table'][param_name] = {'params' :[]}
+                                self._build_param['table'][param_name] = {'params': []}
                                table_meta = table.TableMeta.alloc_new_table(inference_param['table_id'])
                                self._build_param['table'][param_name]['_meta'] = table_meta
                            self._build_param['table'][param_name]['params'] += inference_param['params']

--- a/fleetrec/models/ctr_dnn/model.py
+++ b/fleetrec/models/ctr_dnn/model.py
@@ -16,24 +16,17 @@ import math
 import paddle.fluid as fluid

 from fleetrec.utils import envs
+from fleetrec.models.base import Model


-class Train(object):
-
-    def __init__(self):
-        self.sparse_inputs = []
-        self.dense_input = None
-        self.label_input = None
-
-        self.sparse_input_varnames = []
-        self.dense_input_varname = None
-        self.label_input_varname = None
-        
+class Train(Model):
+    def __init__(self, config):
+        super().__init__(config)
        self.namespace = "train.model"

    def input(self):
        def sparse_inputs():
-            ids = envs.get_global_env("hyper_parameters.sparse_inputs_slots", None ,self.namespace)
+            ids = envs.get_global_env("hyper_parameters.sparse_inputs_slots", None, self.namespace)

            sparse_input_ids = [
                fluid.layers.data(name="C" + str(i),
@@ -44,7 +37,7 @@ class Train(object):
            return sparse_input_ids, [var.name for var in sparse_input_ids]

        def dense_input():
-            dim = envs.get_global_env("hyper_parameters.dense_input_dim", None ,self.namespace)
+            dim = envs.get_global_env("hyper_parameters.dense_input_dim", None, self.namespace)

            dense_input_var = fluid.layers.data(name="dense_input",
                                                shape=[dim],
@@ -65,10 +58,10 @@ class Train(object):
    def input_varnames(self):
        return [input.name for input in self.input_vars()]

-    def net(self):
+    def build_model(self):
        def embedding_layer(input):
-            sparse_feature_number = envs.get_global_env("hyper_parameters.sparse_feature_number", None ,self.namespace)
-            sparse_feature_dim = envs.get_global_env("hyper_parameters.sparse_feature_dim", None ,self.namespace)
+            sparse_feature_number = envs.get_global_env("hyper_parameters.sparse_feature_number", None, self.namespace)
+            sparse_feature_dim = envs.get_global_env("hyper_parameters.sparse_feature_dim", None, self.namespace)

            emb = fluid.layers.embedding(
                input=input,
@@ -94,7 +87,7 @@ class Train(object):
        concated = fluid.layers.concat(sparse_embed_seq + [self.dense_input], axis=1)

        fcs = [concated]
-        hidden_layers = envs.get_global_env("hyper_parameters.fc_sizes", None ,self.namespace)
+        hidden_layers = envs.get_global_env("hyper_parameters.fc_sizes", None, self.namespace)

        for size in hidden_layers:
            fcs.append(fc(fcs[-1], size))
@@ -111,30 +104,34 @@ class Train(object):

    def avg_loss(self):
        cost = fluid.layers.cross_entropy(input=self.predict, label=self.label_input)
-        avg_cost = fluid.layers.reduce_sum(cost)
-        self.loss = avg_cost
-        return avg_cost
+        avg_cost = fluid.layers.reduce_mean(cost)
+        self._cost = avg_cost

    def metrics(self):
        auc, batch_auc, _ = fluid.layers.auc(input=self.predict,
                                             label=self.label_input,
                                             num_thresholds=2 ** 12,
                                             slide_steps=20)
-        self.metrics = (auc, batch_auc)
-
-        return self.metrics
-
-    def metric_extras(self):
-        self.metric_vars = [self.metrics[0]]
-        self.metric_alias = ["AUC"]
-        self.fetch_interval_batchs = 10 
-        return (self.metric_vars, self.metric_alias, self.fetch_interval_batchs)
+        self._metrics["AUC"] = auc
+        self._metrics["BATCH_AUC"] = batch_auc

    def optimizer(self):
-        learning_rate = envs.get_global_env("hyper_parameters.learning_rate", None ,self.namespace)
+        learning_rate = envs.get_global_env("hyper_parameters.learning_rate", None, self.namespace)
        optimizer = fluid.optimizer.Adam(learning_rate, lazy_mode=True)
        return optimizer

+    def dump_model_program(self, path):
+        pass
+
+    def dump_inference_param(self, params):
+        pass
+
+    def dump_inference_program(self, inference_layer, path):
+        pass
+
+    def shrink(self, params):
+        pass
+

 class Evaluate(object):
    def input(self):

--- a/fleetrec/trainer/cluster_trainer.py
+++ b/fleetrec/trainer/cluster_trainer.py
@@ -70,24 +70,27 @@ class ClusterTrainerWithDataset(TranspileTrainer):
        return strategy

    def init(self, context):
-
-        print("init pass")
-
        self.model.input()
        self.model.net()
-        self.metrics = self.model.metrics()
-        self.metric_extras = self.model.metric_extras()
-
-        loss = self.model.avg_loss()
+        self.model.metrics()
+        self.model.avg_loss()
        optimizer = self.model.optimizer()

        strategy = self.build_strategy()
        optimizer = fleet.distributed_optimizer(optimizer, strategy)
-        optimizer.minimize(loss)
+        optimizer.minimize(self.model._cost)

        if fleet.is_server():
            context['status'] = 'server_pass'
        else:
+            self.fetch_vars = []
+            self.fetch_alias = []
+            self.fetch_period = self.model.get_fetch_period()
+
+            metrics = self.model.get_metrics()
+            if metrics:
+                self.fetch_vars = metrics.values()
+                self.fetch_alias = metrics.keys()
            context['status'] = 'train_pass'

    def server(self, context):
@@ -95,23 +98,19 @@ class ClusterTrainerWithDataset(TranspileTrainer):
        fleet.run_server()
        context['is_exit'] = True

-    def terminal(self, context):
-        fleet.stop_worker()
-        context['is_exit'] = True
-
    def train(self, context):
-        self.exe.run(fleet.startup_program)
+        self._exe.run(fleet.startup_program)
        fleet.init_worker()

        dataset = self._get_dataset()
        epochs = envs.get_global_env("train.epochs")

        for i in range(epochs):
-            self.exe.train_from_dataset(program=fluid.default_main_program(),
-                                        dataset=dataset,
-                                        fetch_list=self.metric_extras[0],
-                                        fetch_info=self.metric_extras[1],
-                                        print_period=self.metric_extras[2])
+            self._exe.train_from_dataset(program=fluid.default_main_program(),
+                                         dataset=dataset,
+                                         fetch_list=self.fetch_vars,
+                                         fetch_info=self.fetch_alias,
+                                         print_period=self.fetch_period)
            self.save(i, "train", is_fleet=True)
        context['status'] = 'infer_pass'
        fleet.stop_worker()

--- a/fleetrec/trainer/ctr_trainer.py
+++ b/fleetrec/trainer/ctr_trainer.py
@@ -82,10 +82,6 @@ class CtrPaddleTrainer(Trainer):
        config['output_path'] = util.get_absolute_path(
            config['output_path'], config['io']['afs'])

-        self._place = fluid.CPUPlace()
-        self._exe = fluid.Executor(self._place)
-        self._exector_context = {}
-
        self.global_config = config
        self._metrics = {}


--- a/fleetrec/trainer/single_trainer.py
+++ b/fleetrec/trainer/single_trainer.py
@@ -46,29 +46,35 @@ class SingleTrainerWithDataset(TranspileTrainer):
    def init(self, context):
        self.model.input()
        self.model.net()
-        self.metrics = self.model.metrics()
-        self.metric_extras = self.model.metric_extras()
-
-        loss = self.model.avg_loss()
+        self.model.metrics()
+        self.model.avg_loss()
        optimizer = self.model.optimizer()
-        optimizer.minimize(loss)
+        optimizer.minimize(self.model._cost)
+
+        self.fetch_vars = []
+        self.fetch_alias = []
+        self.fetch_period = self.model.get_fetch_period()

+        metrics = self.model.get_metrics()
+        if metrics:
+            self.fetch_vars = metrics.values()
+            self.fetch_alias = metrics.keys()
        context['status'] = 'train_pass'

    def train(self, context):
        # run startup program at once
-        self.exe.run(fluid.default_startup_program())
+        self._exe.run(fluid.default_startup_program())

        dataset = self._get_dataset()

        epochs = envs.get_global_env("train.epochs")

        for i in range(epochs):
-            self.exe.train_from_dataset(program=fluid.default_main_program(),
-                                        dataset=dataset,
-                                        fetch_list=self.metric_extras[0],
-                                        fetch_info=self.metric_extras[1],
-                                        print_period=self.metric_extras[2])
+            self._exe.train_from_dataset(program=fluid.default_main_program(),
+                                         dataset=dataset,
+                                         fetch_list=self.fetch_vars,
+                                         fetch_info=self.fetch_alias,
+                                         print_period=self.fetch_period)
            self.save(i, "train", is_fleet=False)
        context['status'] = 'infer_pass'


--- a/fleetrec/trainer/trainer.py
+++ b/fleetrec/trainer/trainer.py
@@ -15,19 +15,23 @@
 import abc
 import time
 import yaml
+from paddle import fluid

-from .. utils import envs
+from ..utils import envs


 class Trainer(object):
    """R
-    """   
+    """
    __metaclass__ = abc.ABCMeta

    def __init__(self, config=None):
        self._status_processor = {}
+        self._place = fluid.CPUPlace()
+        self._exe = fluid.Executor(self._place)
+        self._exector_context = {}
        self._context = {'status': 'uninit', 'is_exit': False}
-       
+
    def regist_context_processor(self, status_name, processor):
        """
        regist a processor for specify status
@@ -46,7 +50,7 @@ class Trainer(object):
            self._status_processor[context['status']](context)
        else:
            self.other_status_processor(context)
-    
+
    def other_status_processor(self, context):
        """
        if no processor match context.status, use defalut processor