pass run time

f2129b19 · Yang Yang · e9ddaaba · f2129b19
显示空白变更内容
内联并排

Showing with 43 addition and 14 deletion

python/paddle/v2/fluid/backward.py python/paddle/v2/fluid/backward.py +43 -14

未找到文件。
--- a/python/paddle/v2/fluid/backward.py
+++ b/python/paddle/v2/fluid/backward.py
@@ -199,6 +199,15 @@ def _remove_no_grad_branch_(op_descs, no_grad_set):
    return op_descs
+import proto.framework_pb2 as framework_pb2
+def serialize_op_decs(op_desc):
+    protostr = op_desc.serialize_to_string()
+    proto = framework_pb2.OpDesc.FromString(str(protostr))
+    return proto.__str__()
 def _callback_lookup_(op):
    """
    Only used in _append_backward_ops_
@@ -209,7 +218,6 @@ def _callback_lookup_(op):
    :param op:
    :return: callback function
    """
-    print(op.type)
    if op.type == 'parallel_do':
        param_names = set(op.input('parameters'))
        param_grad_names = [n + "@GRAD" for n in param_names]
@@ -220,20 +228,38 @@ def _callback_lookup_(op):
                self.param_grad_names = param_grad_names
            def __call__(self, block, context):
-                # TODO(tonyyang-svail): insert nccl init
+                # move to parallel_do.py
+                # # TODO(tonyyang-svail): insert nccl init
-                for o_param in context.output_names():
+                if not self.has_inserted_nccl_init:
-                    for o_argu in context.output(o_param):
+                    global_block = block.program.global_block()
-                        if o_argu in self.param_grad_names:
+                    op_desc = global_block.desc.append_op()
-                            print("reduce", o_argu)
+                    var_desc = global_block.desc.var('nccl_com')
-                            op_desc = block.desc.append_op()
+                    var_desc.set_type(core.VarDesc.VarType.NCCL_COM)
+                    self.nccl_com = global_block.create_var(
+                        name='nccl_com', type=core.VarDesc.VarType.NCCL_COM)
                    framework.Operator(
-                                block,
+                        global_block,
-                                type='fill_constant',
+                        type='ncclInit',
                        desc=op_desc,
                        inputs={},
-                                attrs={'shape': [1], },
+                        outputs={'Communicator': [self.nccl_com]})
-                                outputs={'Out': [block.create_var()]})
+                    self.has_inserted_nccl_init = True
+                current_op_desc = context["__current_op_desc__"]
+                # print(serialize_op_decs(context))
+                for o_param in current_op_desc.output_names():
+                    for o_argu in current_op_desc.output(o_param):
+                        if o_argu in self.param_grad_names:
+                            # print("reduce", o_argu)
+                            op_desc = block.desc.append_op()
+                            op_desc.set_type("ncclAllReduce")
+                            op_desc.set_input("X", [o_argu])
+                            # FIXME(tonyyang-svail):
+                            #  Looks like nccl_com has been changed to nccl_com_0
+                            op_desc.set_input("Communicator", ['nccl_com_0'])
+                            out_var = block.create_var()
+                            op_desc.set_output("Out", [out_var.name])
+                            op_desc.set_attr("reduction", "ncclSum")
        return ParallelDoCallBack(param_grad_names)
    else:
@@ -300,7 +326,8 @@ def _append_backward_ops_(block,
    for op_desc in grad_op_descs:
        new_op_desc = target_block.desc.append_op()
        new_op_desc.copy_from(op_desc)
-        callback(block=target_block, context=new_op_desc)
+        grad_to_var["__current_op_desc__"] = new_op_desc
+        callback(block=target_block, context=grad_to_var)
 def _append_backward_vars_(block, start_op_idx, grad_to_var, grad_info_map):
@@ -336,6 +363,8 @@ def _append_backward_vars_(block, start_op_idx, grad_to_var, grad_info_map):
                continue
            grad_info_map[grad_to_var[grad_var_name]] = (grad_var_name, block)
        # infer_shape and infer_type
+        if op_desc.type() == 'ncclInit':
+            continue
        op_desc.infer_var_type(block.desc)
        op_desc.infer_shape(block.desc)
        for arg in op_desc.output_arg_names():