wip need ut

b4cd7f3d · typhoonzero · 489b9695 · b4cd7f3d · b4cd7f3d · b4cd7f3d
8 changed file
--- a/paddle/operators/detail/send_impl.cc
+++ b/paddle/operators/detail/send_impl.cc
@@ -37,6 +37,7 @@ bool RPCClient::SendVariable(const framework::Scope& scope,
  msg.set_serialized(oss.str());
  Status status = stub_->SendVariable(&context, msg, &out_msg);
  if (!status.ok()) {
+    LOG(ERROR) << "gRPC error: " << status.error_message();
    return false;
  }
  std::istringstream iss(out_msg.serialized());

--- a/paddle/operators/recv_op.cc
+++ b/paddle/operators/recv_op.cc
@@ -64,12 +64,12 @@ class RecvOp : public framework::OperatorBase {
  void Run(const framework::Scope &scope,
           const platform::DeviceContext &dev_ctx) const override {
+    // FIXME(typhoonzero): no new scopes for every run.
    framework::Scope &recv_scope = scope.NewScope();
    // blocking get one var from client.
    const detail::TensorWithName &v = rpc_service_->Get();
    auto grad_var_name = v.first;
-    // framework::Scope &recv_scope = scope.NewScope();
    auto param_list = Attr<std::vector<std::string>>("ParamList");
    auto grad_list = Attr<std::vector<std::string>>("GradList");
    auto it = std::find(grad_list.begin(), grad_list.end(), grad_var_name);
@@ -77,16 +77,23 @@ class RecvOp : public framework::OperatorBase {
    if (it != grad_list.end()) {
      param_var_name = param_list[it - grad_list.begin()];
    }
-    // set graph input var
+    // find input by "grad_var_name"
-    auto input_grad = Input("RX");
+    // auto inputs = Inputs("RX");
    // FIXME(typhoonzero): Find the parameter name from input grad name
    // rename X  -> Param
    // rename RX -> Grad
-    auto *var = recv_scope.FindVar(input_grad);
+    LOG(ERROR) << "recved grad: " << grad_var_name
+               << " param: " << param_var_name;
+    auto *var = recv_scope.Var(grad_var_name);
    auto *tensor = var->GetMutable<framework::LoDTensor>();
-    recv_scope.Rename(param_var_name, "Param");
-    recv_scope.Rename("RX", "Grad");
+    // Param is in parent scope, put it in current scope.
+    auto *param_var = recv_scope.FindVar(param_var_name);
+    auto param_scope = recv_scope.FindScope(param_var);
+    param_scope->Rename(param_var_name, "Param");
+    recv_scope.Rename(grad_var_name, "Grad");
    // FIXME(typhoonzero): do not copy
    framework::CopyFrom(v.second, dev_ctx.GetPlace(), dev_ctx, tensor);
@@ -100,14 +107,14 @@ class RecvOp : public framework::OperatorBase {
    executor.Run(program, &recv_scope, 0, /*global_block*/
                 false /*create_local_scope*/);
-    auto *out_var = recv_scope.FindVar("Param");
+    auto *out_var = recv_scope.FindVar("ParamOut");
    detail::TensorWithName out;
    out.first = param_var_name;
    out.second = out_var->Get<framework::LoDTensor>();
    rpc_service_->Push(out);
    // rename back the params
-    recv_scope.Rename("Param", param_var_name);
+    param_scope.Rename("Param", param_var_name);
-    recv_scope.Rename("Grad", "RX");
+    recv_scope.Rename("Grad", grad_var_name);
  }
 protected:
@@ -117,7 +124,6 @@ class RecvOp : public framework::OperatorBase {
  // grpc send/recv service implement to register.
  std::shared_ptr<detail::SendRecvServerImpl> rpc_service_;
  std::shared_ptr<std::thread> server_thread_;
-  framework::Scope const *recv_scope_{nullptr};
 };
 class RecvOpMaker : public framework::OpProtoAndCheckerMaker {

--- a/paddle/operators/send_op.cc
+++ b/paddle/operators/send_op.cc
@@ -47,6 +47,7 @@ class SendOp : public framework::OperatorBase {
    // TODO(typhoonzero): currently it's non-blocking,
    // should block until server responds.
    for (auto in : ins) {
+      LOG(ERROR) << "sending grad: " << in;
      bool ret = client_->SendVariable(scope, in, in);
      if (!ret) {
        LOG(ERROR) << "send variable error";

--- a/paddle/pybind/protobuf.cc
+++ b/paddle/pybind/protobuf.cc
@@ -250,6 +250,12 @@ void BindOpDesc(py::module &m) {
      .def("set_attr", &OpDescBind::SetAttr)
      .def("attr", &OpDescBind::GetAttr)
      .def("set_block_attr", &OpDescBind::SetBlockAttr)
+      .def("set_serialized_attr",
+           [](OpDescBind &self, const std::string &name,
+              const py::bytes &seriralized) {
+             std::string ser(seriralized);
+             self.SetAttr(name, ser);
+           })
      .def("block_attr", &OpDescBind::GetBlockAttr)
      .def("check_attrs", &OpDescBind::CheckAttrs)
      .def("infer_shape", &OpDescBind::InferShape)

--- a/python/paddle/v2/fluid/distribute_planner.py
+++ b/python/paddle/v2/fluid/distribute_planner.py
@@ -29,19 +29,19 @@ def hash_name_to_server(params_grads, pserver_endpoints):
    return param_grad_map
-def round_robin(parameters, pserver_endpoints):
+def round_robin(params_grads, pserver_endpoints):
-    assert (len(parameters) > len(pserver_endpoints))
+    assert (len(params_grads) > len(pserver_endpoints))
    param_grad_map = dict()
    pserver_idx = 0
-    for param in parameters:
+    for param, grad in params_grads:
        if param.trainable is True:
            server_for_param = pserver_endpoints[pserver_idx]
            if not param_grad_map.has_key(server_for_param):
                param_grad_map[server_for_param] = {"params": [], "grads": []}
            param_grad_map[server_for_param]["params"].append(param)
-            param_grad_map[server_for_param]["grads"].append(param)
+            param_grad_map[server_for_param]["grads"].append(grad)
            pserver_idx += 1
            if pserver_idx >= len(pserver_endpoints):

--- a/python/paddle/v2/fluid/executor.py
+++ b/python/paddle/v2/fluid/executor.py
@@ -70,6 +70,31 @@ class Executor(object):
            return self._optimize_distributed(optimize_ops, program,
                                              params_grads, **kwargs)
+    def _clone_param(self, block, v):
+        assert isinstance(v, Parameter)
+        new_p = Parameter(
+            block=block,
+            shape=v.shape,
+            dtype=v.dtype,
+            type=v.type,
+            lod_level=v.lod_level,
+            stop_gradient=v.stop_gradient,
+            trainable=v.trainable,
+            optimize_attr=v.optimize_attr,
+            regularizer=v.regularizer,
+            name=v.name)
+        block.vars[new_p.name] = new_p
+    def _clone_var(self, block, var):
+        assert isinstance(var, Variable)
+        return block.create_var(
+            name=var.name,
+            shape=var.shape,
+            dtype=var.dtype,
+            type=var.type,
+            lod_level=var.lod_level,
+            persistable=True)
    def _optimize_distributed(self, optimize_ops, program, params_and_grads,
                              **kwargs):
        # remove optimize ops and add a send op to main_program
@@ -84,8 +109,7 @@ class Executor(object):
        assert (callable(split_method))
        pserver_endpoints = kwargs["pservers"].split(",")
-        params = program.global_block().all_parameters()
+        self.param_grad_map = split_method(params_and_grads, pserver_endpoints)
-        self.param_grad_map = split_method(params, pserver_endpoints)
        for ep in pserver_endpoints:
            # FIXME(typhoonzero): send to different servers can run in parrallel.
@@ -95,27 +119,26 @@ class Executor(object):
                        },  # inputs is a list of tensors to be send
                outputs={},
                attrs={"endpoint": ep})
-        # -------------- generate optimize sub program --------------
-        self.optimize_sub_program = Program()
-        for opt_op in optimize_ops:
-            self.optimize_sub_program.global_block().ops.append(opt_op)
-    def get_pserver_program(self, endpoint):
+    def get_pserver_program(self, endpoint, optimize_ops):
        pserver_program = Program()
        for v in self.param_grad_map[endpoint]["params"]:
-            assert isinstance(v, Parameter)
+            self._clone_param(pserver_program.global_block(), v)
-            new_p = Parameter(
-                block=pserver_program.global_block(),
+        optimize_sub_program = Program()
-                shape=v.shape,
+        for opt_op in optimize_ops:
-                dtype=v.dtype,
+            for varname, var in opt_op.inputs.iteritems():
-                type=v.type,
+                optimize_sub_program.global_block().create_var(
-                lod_level=v.lod_level,
+                    name=var.name,
-                stop_gradient=v.stop_gradient,
+                    persistable=var.persistable,
-                trainable=v.trainable,
+                    dtype=var.dtype,
-                optimize_attr=v.optimize_attr,
+                    shape=var.shape)
-                regularizer=v.regularizer,
+            optimize_sub_program.global_block().append_op(
-                name=v.name)
+                type=opt_op.type,
-            pserver_program.global_block().vars[new_p.name] = new_p
+                inputs=opt_op.inputs,
+                outputs=opt_op.outputs,
+                attrs=opt_op.attrs)
+        print("optimize program: ", optimize_sub_program)
        pserver_program.global_block().append_op(
            type="recv",
@@ -123,11 +146,14 @@ class Executor(object):
                    self.param_grad_map[endpoint]["grads"]},  # grads to recv
            outputs={},
            attrs={
-                "OptimizeProgram": self.optimize_sub_program.to_string(True),
+                "OptimizeProgram": optimize_sub_program.desc,
                "endpoint": endpoint,
-                "ParamList": self.param_grad_map[endpoint]["params"],
+                "ParamList":
-                "GradList": self.param_grad_map[endpoint]["grads"]
+                [p.name for p in self.param_grad_map[endpoint]["params"]],
+                "GradList":
+                [p.name for p in self.param_grad_map[endpoint]["grads"]]
            })
+        pserver_program.sync_with_cpp()
        return pserver_program
    def aslodtensor(self, data):

--- a/python/paddle/v2/fluid/framework.py
+++ b/python/paddle/v2/fluid/framework.py
@@ -227,6 +227,10 @@ class Operator(object):
                 attrs=None):
        self.block = block
        self.desc = desc
+        # for clone a new operator
+        self.inputs = inputs
+        self.outputs = outputs
+        self.attrs = attrs
        if len(self.desc.type()) != 0:
            return
        if type is None:
@@ -298,6 +302,10 @@ class Operator(object):
                    continue
                if isinstance(attrs[attr_name], Block):
                    self.desc.set_block_attr(attr_name, attrs[attr_name].desc)
+                elif isinstance(attrs[attr_name], core.BlockDesc) or \
+                   isinstance(attrs[attr_name], core.ProgramDesc):
+                    self.desc.set_serialized_attr(
+                        attr_name, attrs[attr_name].serialize_to_string())
                else:
                    self.desc.set_attr(attr_name, attrs[attr_name])

--- a/python/paddle/v2/fluid/tests/book/test_recognize_digits_conv_dist.py
+++ b/python/paddle/v2/fluid/tests/book/test_recognize_digits_conv_dist.py
@@ -43,10 +43,11 @@ exe.optimize(optimize_ops, params_grads, pservers="127.0.0.1:6174", trainers=1)
 pserver_endpoint = os.getenv("PSERVER")
 if pserver_endpoint:
-    pserver_prog = exe.get_pserver_program(pserver_endpoint)
+    pserver_prog = exe.get_pserver_program(pserver_endpoint, optimize_ops)
    exe.run(fluid.default_startup_program())
    while True:
        exe.run(pserver_prog)
+        print("Run pserver once end...")
 else:
    feeder = fluid.DataFeeder(feed_list=[images, label], place=place)
    exe.run(fluid.default_startup_program())