From 25d9cef989081300d95c0d37b8066617f87b848e Mon Sep 17 00:00:00 2001
From: linan17 <linan17@baidu.com>
Date: Thu, 9 Jan 2020 18:46:05 +0800
Subject: [PATCH] update for news cp, userdefine file name

Change-Id: I13db8b30ed1abcbca8cb74105c5fe912fe7f929b
---
 paddle/fluid/framework/dist_multi_trainer.cc  |  6 +++++
 paddle/fluid/framework/trainer.h              |  1 +
 paddle/fluid/framework/trainer_desc.proto     |  3 ++-
 .../pslib/optimizer_factory.py                |  1 +
 .../fluid/incubate/fleet/utils/fleet_util.py  | 24 ++++++++++++-----
 python/paddle/fluid/trainer_desc.py           |  3 +++
 python/paddle/fluid/trainer_factory.py        | 26 +++++++++++++------
 7 files changed, 49 insertions(+), 15 deletions(-)
 mode change 100644 => 100755 paddle/fluid/framework/dist_multi_trainer.cc
 mode change 100644 => 100755 paddle/fluid/framework/trainer.h
 mode change 100644 => 100755 paddle/fluid/framework/trainer_desc.proto
 mode change 100644 => 100755 python/paddle/fluid/incubate/fleet/parameter_server/pslib/optimizer_factory.py
 mode change 100644 => 100755 python/paddle/fluid/trainer_desc.py
 mode change 100644 => 100755 python/paddle/fluid/trainer_factory.py

diff --git a/paddle/fluid/framework/dist_multi_trainer.cc b/paddle/fluid/framework/dist_multi_trainer.cc
old mode 100644
new mode 100755
index 56a9ebc3..97fd0553
--- a/paddle/fluid/framework/dist_multi_trainer.cc
+++ b/paddle/fluid/framework/dist_multi_trainer.cc
@@ -34,6 +34,7 @@ void DistMultiTrainer::Initialize(const TrainerDesc &trainer_desc,
   if (trainer_desc.dump_fields_size() != 0 && dump_fields_path_ != "") {
     need_dump_field_ = true;
   }
+  user_define_dump_filename_ = trainer_desc.user_define_dump_filename();
   if (need_dump_field_) {
     auto &file_list = dataset->GetFileList();
     if (file_list.size() == 0) {
@@ -96,6 +97,11 @@ void DistMultiTrainer::InitDumpEnv() {
   std::string path = string::format_string(
       "%s/part-%03d", dump_fields_path_.c_str(), mpi_rank_);
 
+  if (user_define_dump_filename_ != "") {
+    path = string::format_string("%s/part-%s", dump_fields_path_.c_str(),
+                                 user_define_dump_filename_.c_str());
+  }
+
   fp_ = fs_open_write(path, &err_no, dump_converter_);
   for (int i = 0; i < thread_num_; ++i) {
     workers_[i]->SetChannelWriter(queue_.get());
diff --git a/paddle/fluid/framework/trainer.h b/paddle/fluid/framework/trainer.h
old mode 100644
new mode 100755
index 170ceb50..4ca303ce
--- a/paddle/fluid/framework/trainer.h
+++ b/paddle/fluid/framework/trainer.h
@@ -101,6 +101,7 @@ class DistMultiTrainer : public MultiTrainer {
 
   bool need_dump_field_;
   std::string dump_fields_path_;
+  std::string user_define_dump_filename_;
   std::string dump_converter_;
   std::vector<std::string> dump_fields_;
   int mpi_rank_;
diff --git a/paddle/fluid/framework/trainer_desc.proto b/paddle/fluid/framework/trainer_desc.proto
old mode 100644
new mode 100755
index 2724be65..284c78ba
--- a/paddle/fluid/framework/trainer_desc.proto
+++ b/paddle/fluid/framework/trainer_desc.proto
@@ -39,7 +39,8 @@ message TrainerDesc {
   optional string dump_fields_path = 12;
   repeated string dump_fields = 13;
   optional string dump_converter = 14;
-
+  optional string user_define_dump_filename = 15;
+  
   // device worker parameters
   optional HogwildWorkerParameter hogwild_param = 101;
   optional DownpourWorkerParameter downpour_param = 103;
diff --git a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/optimizer_factory.py b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/optimizer_factory.py
old mode 100644
new mode 100755
index 57e8c31d..a746292a
--- a/python/paddle/fluid/incubate/fleet/parameter_server/pslib/optimizer_factory.py
+++ b/python/paddle/fluid/incubate/fleet/parameter_server/pslib/optimizer_factory.py
@@ -252,6 +252,7 @@ class DistributedAdam(DistributedOptimizerImplBase):
         opt_info["dump_converter"] = ""
         opt_info["dump_fields"] = strategy.get("dump_fields", [])
         opt_info["dump_fields_path"] = strategy.get("dump_fields_path", "")
+        opt_info["user_define_dump_filename"] = strategy.get("user_define_dump_filename", "")
         if server._server.downpour_server_param.downpour_table_param[
                 0].accessor.accessor_class == "DownpourCtrAccessor":
             opt_info["dump_slot"] = True
diff --git a/python/paddle/fluid/incubate/fleet/utils/fleet_util.py b/python/paddle/fluid/incubate/fleet/utils/fleet_util.py
index 6813b767..fa55483c 100644
--- a/python/paddle/fluid/incubate/fleet/utils/fleet_util.py
+++ b/python/paddle/fluid/incubate/fleet/utils/fleet_util.py
@@ -312,7 +312,9 @@ class FleetUtil(object):
                       data_path,
                       hadoop_fs_name,
                       monitor_data={},
-                      mode="patch"):
+                      mode="patch",
+                      dir_name="000",
+                      base_only=False):
         xbox_dict = collections.OrderedDict()
         if mode == "base":
             xbox_dict["id"] = str(xbox_base_key)
@@ -322,10 +324,13 @@ class FleetUtil(object):
             print("warning: unknown mode %s, set it to patch" % mode)
             mode = "patch"
             xbox_dict["id"] = str(int(time.time()))
-        xbox_dict["key"] = str(xbox_base_key)
+        if base_only:
+            xbox_dict["key"] = str(int(time.time()))
+        else:
+            xbox_dict["key"] = str(xbox_base_key)
         if model_path.startswith("hdfs:") or model_path.startswith("afs:"):
             model_path = model_path[model_path.find(":") + 1:]
-        xbox_dict["input"] = hadoop_fs_name + model_path.rstrip("/") + "/000"
+        xbox_dict["input"] = hadoop_fs_name + model_path.rstrip("/") + "/%s" % dir_name
         xbox_dict["record_count"] = "111111"
         xbox_dict["partition_type"] = "2"
         xbox_dict["job_name"] = "default_job_name"
@@ -449,7 +454,9 @@ class FleetUtil(object):
                             hadoop_fs_ugi,
                             monitor_data={},
                             hadoop_home="$HADOOP_HOME",
-                            donefile_name=None):
+                            donefile_name=None,
+                            dir_name=None,
+                            base_only=False):
         """
         write delta donefile or xbox base donefile
 
@@ -501,14 +508,17 @@ class FleetUtil(object):
             if donefile_name is None:
                 donefile_name = "xbox_base_done.txt"
 
+        if dir_name is None:
+            dir_name = "000"
+
         if isinstance(data_path, list):
             data_path = ",".join(data_path)
 
         if fleet.worker_index() == 0:
             donefile_path = output_path + "/" + donefile_name
             xbox_str = self._get_xbox_str(output_path, day, model_path, \
-                    xbox_base_key, data_path, hadoop_fs_name, monitor_data={},
-                    mode=mode)
+                    xbox_base_key, data_path, hadoop_fs_name, {}, \
+                    mode, dir_name, base_only)
             configs = {
                 "fs.default.name": hadoop_fs_name,
                 "hadoop.job.ugi": hadoop_fs_ugi
@@ -519,6 +529,8 @@ class FleetUtil(object):
                 last_dict = json.loads(pre_content.split("\n")[-1])
                 last_day = last_dict["input"].split("/")[-3]
                 last_pass = last_dict["input"].split("/")[-2].split("-")[-1]
+                if last_pass == "base":
+                    last_pass = "-1"
                 exist = False
                 if int(day) < int(last_day) or \
                         int(day) == int(last_day) and \
diff --git a/python/paddle/fluid/trainer_desc.py b/python/paddle/fluid/trainer_desc.py
old mode 100644
new mode 100755
index 21522da4..81396e4f
--- a/python/paddle/fluid/trainer_desc.py
+++ b/python/paddle/fluid/trainer_desc.py
@@ -91,6 +91,9 @@ class TrainerDesc(object):
     def _set_dump_fields_path(self, path):
         self.proto_desc.dump_fields_path = path
 
+    def _set_user_define_dump_filename(self, user_define_dump_filename):
+        self.proto_desc.user_define_dump_filename = user_define_dump_filename
+
     def _set_dump_converter(self, converter):
         self.proto_desc.dump_converter = converter
 
diff --git a/python/paddle/fluid/trainer_factory.py b/python/paddle/fluid/trainer_factory.py
old mode 100644
new mode 100755
index 5f312ea0..c0fe0009
--- a/python/paddle/fluid/trainer_factory.py
+++ b/python/paddle/fluid/trainer_factory.py
@@ -38,13 +38,23 @@ class TrainerFactory(object):
             if "fleet_desc" in opt_info:
                 device_worker._set_fleet_desc(opt_info["fleet_desc"])
                 trainer._set_fleet_desc(opt_info["fleet_desc"])
-                trainer._set_use_cvm(opt_info["use_cvm"])
-                trainer._set_scale_datanorm(opt_info["scale_datanorm"])
-                trainer._set_dump_slot(opt_info["dump_slot"])
-                trainer._set_mpi_rank(opt_info["mpi_rank"])
-                trainer._set_dump_fields(opt_info["dump_fields"])
-                trainer._set_dump_fields_path(opt_info["dump_fields_path"])
-                trainer._set_dump_converter(opt_info["dump_converter"])
-                trainer._set_adjust_ins_weight(opt_info["adjust_ins_weight"])
+                if opt_info.get("use_cvm") is not None:
+                    trainer._set_use_cvm(opt_info["use_cvm"])
+                if opt_info.get("scale_datanorm") is not None:
+                    trainer._set_scale_datanorm(opt_info["scale_datanorm"])
+                if opt_info.get("dump_slot") is not None:
+                    trainer._set_dump_slot(opt_info["dump_slot"])
+                if opt_info.get("mpi_rank") is not None:
+                    trainer._set_mpi_rank(opt_info["mpi_rank"])
+                if opt_info.get("dump_fields") is not None:
+                    trainer._set_dump_fields(opt_info["dump_fields"])
+                if opt_info.get("dump_fields_path") is not None:
+                    trainer._set_dump_fields_path(opt_info["dump_fields_path"])
+                if opt_info.get("user_define_dump_filename") is not None:
+                    trainer._set_user_define_dump_filename(opt_info["user_define_dump_filename"])
+                if opt_info.get("dump_converter") is not None:
+                    trainer._set_dump_converter(opt_info["dump_converter"])
+                if opt_info.get("adjust_ins_weight") is not None:
+                    trainer._set_adjust_ins_weight(opt_info["adjust_ins_weight"])
             trainer._set_device_worker(device_worker)
         return trainer
-- 
GitLab