update tdm sampler

0432b71b · chengmo · 432abdc0 · 0432b71b · 0432b71b · 0432b71b
5 changed file
--- a/PaddleRec/tdm/tdm_demo/args.py
+++ b/PaddleRec/tdm/tdm_demo/args.py
@@ -73,7 +73,7 @@ def parse_args():
                   "whether to perform local training")
    main_g.add_arg("is_cloud", bool, False, "")
    main_g.add_arg("is_test", bool, False, "")
-    main_g.add_arg("sync_mode", str, "async","distributed traing mode")
+    main_g.add_arg("sync_mode", str, "async", "distributed traing mode")
    main_g.add_arg("need_trace", bool, False, "")
    main_g.add_arg("need_detail", bool, False, "")
@@ -89,7 +89,13 @@ def parse_args():
    model_g.add_arg("node_nums", int, 26, "tree node nums")
    model_g.add_arg("node_emb_size", int, 64, "node embedding size")
    model_g.add_arg("query_emb_size", int, 768, "input query embedding size")
-    model_g.add_arg("neg_sampling_list", list, [1, 2, 3, 4], "nce sample nums at every layer")
+    model_g.add_arg("neg_sampling_list", list, [
+                    1, 2, 3, 4], "nce sample nums at every layer")
+    model_g.add_arg("layer_node_num_list", list, [
+                    2, 4, 7, 12], "node nums at every layer")
+    model_g.add_arg("leaf_node_num", int, 13, "leaf node nums")
+    # for infer
    model_g.add_arg("child_nums", int, 2, "child node of ancestor node")
    model_g.add_arg("topK", int, 2, "best recall result nums")
@@ -99,10 +105,9 @@ def parse_args():
    model_g.add_arg("test_files_path", str, "./data/test", "test data path")
    model_g.add_arg("model_files_path", str, "./models", "model data path")
    # build tree and warm up
    model_g.add_arg("build_tree_init_path", str,
-                    "./data/gen_tree/demo_fake_input.txt", "build tree embedding path") 
+                    "./data/gen_tree/demo_fake_input.txt", "build tree embedding path")
    model_g.add_arg("warm-up", bool, False,
                    "warm up, builing new tree.")
    model_g.add_arg("rebuild_tree_per_epochs", int, -1,
@@ -135,4 +140,3 @@ def print_arguments(args):
    for arg, value in sorted(six.iteritems(vars(args))):
        print('%s: %s' % (arg, value))
    print('------------------------------------------------')
--- a/PaddleRec/tdm/tdm_demo/data/train/demo_fake_train_data.txt
+++ b/PaddleRec/tdm/tdm_demo/data/train/demo_fake_train_data.txt
--- a/PaddleRec/tdm/tdm_demo/local_train.py
+++ b/PaddleRec/tdm/tdm_demo/local_train.py
@@ -71,15 +71,6 @@ def run_train(args):
    exe = fluid.Executor(place)
    exe.run(fluid.default_startup_program())
-    # Set TDM_Tree Parameter
-    Numpy_model = {}
-    Numpy_model['TDM_Tree_Travel'] = tdm_model.travel_array
-    Numpy_model['TDM_Tree_Layer'] = tdm_model.layer_array
-    Numpy_model['TDM_Tree_Info'] = tdm_model.info_array
-    for param_name in Numpy_model:
-        param_t = fluid.global_scope().find_var(param_name).get_tensor()
-        param_t.set(Numpy_model[str(param_name)].astype('int32'), place)
    if args.load_model:
        path = args.init_model_files_path
        fluid.io.load_persistables(
@@ -89,8 +80,17 @@ def run_train(args):
        lr = fluid.global_scope().find_var("learning_rate_0").get_tensor()
        lr.set(np.array(args.learning_rate).astype('float32'), place)
        logger.info("Load persistables from \"{}\"".format(path))
+    else:
-    if args.save_init_model:
+        # Set TDM_Tree Parameter
+        Numpy_model = {}
+        Numpy_model['TDM_Tree_Travel'] = tdm_model.tdm_sampler_prepare_dict['travel_array']
+        Numpy_model['TDM_Tree_Layer'] = tdm_model.tdm_sampler_prepare_dict['layer_array']
+        Numpy_model['TDM_Tree_Info'] = tdm_model.info_array
+        for param_name in Numpy_model:
+            param_t = fluid.global_scope().find_var(param_name).get_tensor()
+            param_t.set(Numpy_model[str(param_name)].astype('int32'), place)
+    if args.save_init_model or not args.load_model:
        logger.info("Begin Save Init model.")
        model_path = os.path.join(args.model_files_path, "init_model")
        fluid.io.save_persistables(executor=exe, dirname=model_path)

--- a/PaddleRec/tdm/tdm_demo/train_network.py
+++ b/PaddleRec/tdm/tdm_demo/train_network.py
@@ -32,13 +32,23 @@ class TdmTrainNet(object):
        self.max_layers = args.layer_size
        self.neg_sampling_list = args.neg_sampling_list
        self.output_positive = True
-        self.travel_list, self.travel_array, self.layer_list, self.layer_array = tdm_sampler_prepare(
-            args)
-        self.info_list, self.info_array = tdm_child_prepare(args)
        self.need_trace = args.need_trace
        self.need_detail = args.need_detail
+        if not args.load_model:
+            self.tdm_sampler_prepare_dict = tdm_sampler_prepare(args)
+            print("--Layer node num list--: {}".format(
+                self.tdm_sampler_prepare_dict['layer_node_num_list']))
+            self.layer_node_num_list = self.tdm_sampler_prepare_dict['layer_node_num_list']
+            print("--leaf node num--: {}".format(
+                self.tdm_sampler_prepare_dict['leaf_node_num']))
+            self.leaf_node_num = self.tdm_sampler_prepare_dict['leaf_node_num']
+            self.info_array = tdm_child_prepare(args)
+        else:
+            self.layer_node_num_list = args.layer_node_num_list
+            self.leaf_node_num = args.leaf_node_num
        self.get_tree_info(args)
        self.input_trans_layer = InputTransNet(args)
        self.layer_classifier = DnnLayerClassifierNet(args)
@@ -76,19 +86,19 @@ class TdmTrainNet(object):
        trace_var(item_label, "[TDM][inputs]",
                  "item_label", self.need_trace, self.need_detail)
-        sample_nodes, sample_label, sample_mask = fluid.layers.tdm_sampler(
+        sample_nodes, sample_label, sample_mask = fluid.contrib.layers.tdm_sampler(
-            input=item_label,
+            x=item_label,
            neg_samples_num_list=self.neg_sampling_list,
-            tree_travel_list=self.travel_list,
+            layer_node_num_list=self.layer_node_num_list,
-            tree_layer_list=self.layer_list,
+            leaf_node_num=self.leaf_node_num,
            tree_travel_attr=fluid.ParamAttr(name="TDM_Tree_Travel"),
            tree_layer_attr=fluid.ParamAttr(name="TDM_Tree_Layer"),
-            output_labels=True,
            output_positive=self.output_positive,
            output_list=True,
            seed=0,
-            dtype='int64'
+            dtype='int32'
        )
        trace_var(sample_nodes, "[TDM][tdm_sample]",
                  "sample_nodes", self.need_trace, self.need_detail)
        trace_var(sample_label, "[TDM][tdm_sample]",

--- a/PaddleRec/tdm/tdm_demo/utils.py
+++ b/PaddleRec/tdm/tdm_demo/utils.py
@@ -59,18 +59,32 @@ def read_layer_list(path):
 def tdm_sampler_prepare(args):
    """load tdm tree param from list file"""
+    prepare_dict = {}
    travel_list = read_list(args.tree_travel_init_path)
    travel_array = np.array(travel_list)
+    prepare_dict['travel_array'] = travel_array
+    leaf_num = len(travel_list)
+    prepare_dict['leaf_node_num'] = leaf_num
    layer_list, layer_array = read_layer_list(args.tree_layer_init_path)
-    return [travel_list, travel_array, layer_list, layer_array]
+    prepare_dict['layer_array'] = layer_array
+    layer_node_num_list = [len(i) for i in layer_list]
+    prepare_dict['layer_node_num_list'] = layer_node_num_list
+    node_num = int(np.sum(layer_node_num_list))
+    prepare_dict['node_num'] = node_num
+    return prepare_dict
 def tdm_child_prepare(args):
    """load tdm tree param from list file"""
    info_list = read_list(args.tree_info_init_path)
    info_array = np.array(info_list)
-    return info_list, info_array
+    return info_array
 def trace_var(var, msg_prefix, var_name, need_trace=False, need_detail=False):