follow comments

f50e36e2 · qijun · a22606ca · f50e36e2 · f50e36e2 · f50e36e2
8 changed file
--- a/paddle/framework/operator.cc
+++ b/paddle/framework/operator.cc
@@ -123,6 +123,15 @@ OperatorBase::OperatorBase(const std::string& type,
  CheckAllInputOutputSet();
 }
+std::vector<std::string> OperatorBase::InputVars() const {
+  std::vector<std::string> ret_val;
+  for (auto& o : outputs_) {
+    ret_val.reserve(ret_val.size() + o.second.size());
+    ret_val.insert(ret_val.end(), o.second.begin(), o.second.end());
+  }
+  return ret_val;
+}
 std::vector<std::string> OperatorBase::OutputVars(bool has_intermediate) const {
  std::vector<std::string> ret_val;
  if (has_intermediate) {

--- a/paddle/framework/operator.h
+++ b/paddle/framework/operator.h
@@ -95,31 +95,13 @@ class OperatorBase {
  const VariableNameMap& Inputs() const { return inputs_; }
  const VariableNameMap& Outputs() const { return outputs_; }
-  const std::vector<std::string> InputsNames() const {
-    std::vector<std::string> result;
-    for (auto& kv : inputs_) {
-      for (auto& name : kv.second) {
-        result.push_back(name);
-      }
-    }
-    return result;
-  }
-  const std::vector<std::string> OutputsNames() const {
-    std::vector<std::string> result;
-    for (auto& kv : outputs_) {
-      for (auto& name : kv.second) {
-        result.push_back(name);
-      }
-    }
-    return result;
-  }
  //! Get a input with argument's name described in `op_proto`
  std::string Input(const std::string& name) const;
  //! Get a input which has multiple variables.
  const std::vector<std::string>& Inputs(const std::string& name) const;
+  std::vector<std::string> InputVars() const;
  //! Get a output with argument's name described in `op_proto`
  std::string Output(const std::string& name) const;
  //! Get an output which has multiple variables.

--- a/paddle/operators/sum_op.cc
+++ b/paddle/operators/sum_op.cc
@@ -26,10 +26,14 @@ class SumOp : public framework::OperatorWithKernel {
    auto *out = ctx.Output<framework::Tensor>("Out");
    int N = ins.size();
-    PADDLE_ENFORCE_GT(N, 1, "Input tensors count should > 1.");
+    auto in_dim = ins[0]->dims();
-    auto dim_zero = ins[0]->dims();
+    PADDLE_ENFORCE_GT(N, 1, "Input tensors count should > 1.");
-    out->Resize(dim_zero);
+    for (int i = 1; i < N; i++) {
+      auto dim = ins[i]->dims();
+      PADDLE_ENFORCE(in_dim == dim, "Input tensors must have same shape");
+    }
+    out->Resize(in_dim);
  }
 };

--- a/paddle/pybind/pybind.cc
+++ b/paddle/pybind/pybind.cc
@@ -214,15 +214,10 @@ All parameter, weight, gradient are variables in Paddle.
               -> std::map<std::string, std::vector<std::string>> {
                 return op.Outputs();
               })
-      .def("outputs_names",
+      .def("output_vars",
-           [](const OperatorBase &op) -> std::vector<std::string> {
+           [](const OperatorBase &op) { return op.OutputVars(true); })
-             return op.OutputsNames();
-           })
      .def("inputs", [](const OperatorBase &op) { return op.Inputs(); })
-      .def("inputs_names",
+      .def("input_vars", [](const OperatorBase &op) { return op.InputVars(); })
-           [](const OperatorBase &op) -> std::vector<std::string> {
-             return op.InputsNames();
-           })
      .def("__str__", &OperatorBase::DebugString)
      .def("no_intermediate_outputs",
           [](const OperatorBase &op) { return op.OutputVars(false); })

--- a/python/paddle/v2/framework/tests/op_test.py
+++ b/python/paddle/v2/framework/tests/op_test.py
@@ -9,54 +9,40 @@ def grad_var_name(var_name):
    return var_name + "@GRAD"
-def remove_grad_var_name(var_name):
-    return var_name[0:-5]
 def create_op(scope, op_type, inputs, outputs, attrs=None):
    kwargs = dict()
-    for ins in Operator.get_op_inputs(op_type):
+    for in_name, in_dup in Operator.get_op_inputs(op_type):
-        in_name = ins[0]
-        in_dup = ins[1]
        if in_name in inputs:
            kwargs[in_name] = []
            if in_dup:
                sub_in = inputs[in_name]
                for sub_in_name in sub_in:
                    var = scope.new_var(sub_in_name)
-                    tensor = var.get_tensor()
                    kwargs[in_name].append(sub_in_name)
            else:
                var = scope.new_var(in_name)
-                tensor = var.get_tensor()
                kwargs[in_name].append(in_name)
-    for outs in Operator.get_op_outputs(op_type):
+    for out_name, out_dup in Operator.get_op_outputs(op_type):
-        out_name = outs[0]
-        out_dup = outs[1]
        if out_name in outputs:
            kwargs[out_name] = []
            if out_dup:
                sub_in = outputs[out_name]
                for sun_in_name in sub_in:
                    var = scope.new_var(sun_in_name)
-                    tensor = var.get_tensor()
                    kwargs[out_name].append(sun_in_name)
            else:
                var = scope.new_var(out_name)
-                tensor = var.get_tensor()
                kwargs[out_name].append(out_name)
-    # for attr_name in Operator.get_op_attr_names(op_type):
+    for attr_name in Operator.get_op_attr_names(op_type):
-    #	  kwargs[attr_name] = attrs[attr_name]
+        kwargs[attr_name] = attrs[attr_name]
    return Operator(op_type, **kwargs)
 def set_input(scope, op, inputs, place):
-    for ins in Operator.get_op_inputs(op.type()):
+    for in_name, in_dup in Operator.get_op_inputs(op.type()):
-        in_name = ins[0]
-        in_dup = ins[1]
        if in_name in inputs:
            if in_dup:
                sub_in = inputs[in_name]
@@ -75,9 +61,7 @@ def set_input(scope, op, inputs, place):
 def set_output_grad(scope, op, outputs, place):
-    for outs in Operator.get_op_outputs(op.type()):
+    for out_name, out_dup in Operator.get_op_outputs(op.type()):
-        out_name = outs[0]
-        out_dup = outs[1]
        if out_name in outputs:
            if out_dup:
                sub_out = outputs[out_name]
@@ -150,10 +134,10 @@ def get_numeric_gradient(scope,
 def get_backward_op(scope, op, no_grad_set):
    backward_op = core.Operator.backward(op, no_grad_set)
-    for input in backward_op.inputs_names():
+    for input in backward_op.input_vars():
        var = scope.new_var(input)
        var.get_tensor()
-    for output in backward_op.outputs_names():
+    for output in backward_op.output_vars():
        var = scope.new_var(output)
        var.get_tensor()
    return backward_op
@@ -182,7 +166,7 @@ def get_gradient(scope, op, inputs, outputs, grad_name, place,
 class OpTest(unittest.TestCase):
-    def check_output(self, place):
+    def check_output_with_place(self, place):
        self.scope = core.Scope()
        self.op = create_op(self.scope, self.op_type, self.inputs, self.outputs)
        if isinstance(place, core.GPUPlace) and not self.op.support_gpu():
@@ -192,9 +176,7 @@ class OpTest(unittest.TestCase):
        ctx = core.DeviceContext.create(place)
        self.op.run(self.scope, ctx)
-        for outs in Operator.get_op_outputs(self.op.type()):
+        for out_name, out_dup in Operator.get_op_outputs(self.op.type()):
-            out_name = outs[0]
-            out_dup = outs[1]
            if out_dup:
                sub_out = self.outputs[out_name]
                for sub_out_name in sub_out:
@@ -213,6 +195,13 @@ class OpTest(unittest.TestCase):
                        actual, expect, atol=1e-05),
                    "output name: " + out_name + "has diff")
+    def check_output(self):
+        places = [core.CPUPlace()]
+        if core.is_compile_gpu() and self.op.support_gpu():
+            places.append(core.GPUPlace(0))
+        for place in places:
+            self.check_output_with_place(place)
    def __assert_is_close(self, numeric_grads, analytic_grads, names,
                          max_relative_error, msg_prefix):
@@ -255,17 +244,32 @@ class OpTest(unittest.TestCase):
            grad_var_name(input_to_check) for input_to_check in inputs_to_check
        ]
-        places = [core.CPUPlace()]
+        cpu_place = core.CPUPlace()
-        if core.is_compile_gpu() and self.op.support_gpu():
+        cpu_analytic_grads = [
-            places.append(core.GPUPlace(0))
+            get_gradient(self.scope, self.op, self.inputs, self.outputs,
+                         grad_name, cpu_place, no_grad_set)
+            for grad_name in grad_names
+        ]
-        for place in places:
+        self.__assert_is_close(numeric_grads, cpu_analytic_grads, grad_names,
-            analytic_grads = [
+                               max_relative_error,
+                               "Gradient Check On %s" % str(cpu_place))
+        if core.is_compile_gpu() and self.op.support_gpu():
+            gpu_place = core.GPUPlace(0)
+            gpu_analytic_grads = [
                get_gradient(self.scope, self.op, self.inputs, self.outputs,
-                             grad_name, place, no_grad_set)
+                             grad_name, gpu_place, no_grad_set)
                for grad_name in grad_names
            ]
-            self.__assert_is_close(numeric_grads, analytic_grads, grad_names,
+            self.__assert_is_close(numeric_grads, gpu_analytic_grads,
-                                   max_relative_error,
+                                   grad_names, max_relative_error,
-                                   "Gradient Check On %s" % str(place))
+                                   "Gradient Check On %s" % str(gpu_place))
+            for c_grad, g_grad, name in itertools.izip(
+                    cpu_analytic_grads, gpu_analytic_grads, grad_names):
+                self.assertTrue(
+                    numpy.allclose(
+                        c_grad, g_grad, atol=1e-4),
+                    "output name: " + name + " has diff")
--- a/python/paddle/v2/framework/tests/test_cross_entropy_op.py
+++ b/python/paddle/v2/framework/tests/test_cross_entropy_op.py
 import unittest
 import numpy
 from op_test import OpTest
-import paddle.v2.framework.core as core
 class TestCrossEntropy(OpTest):
    def setUp(self):
        self.op_type = "onehot_cross_entropy"
-        batch_size = 4
+        batch_size = 30
-        class_num = 4
+        class_num = 10
        X = numpy.random.random((batch_size, class_num)).astype("float32")
        label = (class_num / 2) * numpy.ones(batch_size).astype("int32")
        self.inputs = {'X': X, 'label': label}
@@ -18,8 +17,7 @@ class TestCrossEntropy(OpTest):
        self.outputs = {'Y': numpy.array(Y).astype("float32")}
    def test_check_output(self):
-        self.check_output(core.CPUPlace())
+        self.check_output()
-        self.check_output(core.GPUPlace(0))
    def test_check_grad(self):
        self.check_grad(["X"], "Y")

--- a/python/paddle/v2/framework/tests/test_sigmoid_op.py
+++ b/python/paddle/v2/framework/tests/test_sigmoid_op.py
 import unittest
 import numpy as np
 from op_test import OpTest
-import paddle.v2.framework.core as core
 class TestSigmoid(OpTest):
@@ -13,8 +12,7 @@ class TestSigmoid(OpTest):
        self.outputs = {'Y': 1 / (1 + np.exp(-self.inputs['X']))}
    def test_check_output(self):
-        self.check_output(core.CPUPlace())
+        self.check_output()
-        self.check_output(core.GPUPlace(0))
    def test_check_grad(self):
        self.check_grad(["X"], "Y", max_relative_error=0.007)

--- a/python/paddle/v2/framework/tests/test_sum_op.py
+++ b/python/paddle/v2/framework/tests/test_sum_op.py
 import unittest
 import numpy as np
 from op_test import OpTest
-import paddle.v2.framework.core as core
 class TestSumOp(OpTest):
@@ -15,8 +14,7 @@ class TestSumOp(OpTest):
        self.outputs = {'Out': y}
    def test_check_output(self):
-        self.check_output(core.CPUPlace())
+        self.check_output()
-        self.check_output(core.GPUPlace(0))
    def test_check_grad(self):
        self.check_grad(["x0"], "Out")