"on hold"

2ddb1122 · dongzhihong · 56faf513 · 2ddb1122 · 2ddb1122 · 2ddb1122
4 changed file
--- a/paddle/operators/mul_op.cc
+++ b/paddle/operators/mul_op.cc
@@ -54,10 +54,27 @@ The equation is: Out = X * Y

 class MulOpGrad : public framework::OperatorWithKernel {
 protected:
-  void InferShape(const framework::InferShapeContext &ctx) const override {}
-  std::string DebugString() const override {
-    LOG(INFO) << "MulGrad";
-    return "";
+  void InferShape(const framework::InferShapeContext &ctx) const override {
+    PADDLE_ENFORCE_EQ(ctx.InputSize(), 3UL,
+                      "Input of MulOpGrad should be 3, X, Y, Out@GRAD");
+    PADDLE_ENFORCE_EQ(ctx.OutputSize(), 2UL,
+                      "Output of MulOpGrad should be 2, X@GRAD, Y@GRAD");
+    PADDLE_ENFORCE_NOT_NULL(ctx.InputVar("X"), "Input(X) should not be null");
+    PADDLE_ENFORCE_NOT_NULL(ctx.InputVar("Y"), "Input(Y) should not be null");
+    PADDLE_ENFORCE_NOT_NULL(ctx.InputVar(framework::GradVarName("Out")),
+                            "Input(Out@GRAD) should not be null");
+    auto *x_grad = ctx.Output<framework::Tensor>(framework::GradVarName("X"));
+    auto *y_grad = ctx.Output<framework::Tensor>(framework::GradVarName("Y"));
+    auto dim0 = ctx.Input<Tensor>(0)->dims();
+    auto dim1 = ctx.Input<Tensor>(1)->dims();
+    auto out_dims = ctx.Input<Tensor>(2)->dims();
+    PADDLE_ENFORCE(dim0[0] * dim1[0] == out_dims[0],
+                   "Out@GRAD[0] must equal to X[0] * Y[0]");
+    PADDLE_ENFORCE(dim0[1] * dim1[1] == out_dims[1],
+                   "Out@GRAD shape must equal to X[1] * Y[1]");
+
+    x_grad->Resize(dim1);
+    y_grad->Resize(dim0);
  }
 };

@@ -69,3 +86,5 @@ REGISTER_OP(mul, ops::MulOp, ops::MulOpMaker);
 REGISTER_GRADIENT_OP(mul, mul_grad, ops::MulOpGrad);

 REGISTER_OP_CPU_KERNEL(mul, ops::MulKernel<paddle::platform::CPUPlace, float>);
+REGISTER_OP_CPU_KERNEL(mul_grad,
+                       ops::MulGradKernel<paddle::platform::CPUPlace, float>);
--- a/paddle/operators/mul_op.cu
+++ b/paddle/operators/mul_op.cu
@@ -16,5 +16,6 @@
 #include "paddle/operators/mul_op.h"

 namespace ops = paddle::operators;
-
 REGISTER_OP_GPU_KERNEL(mul, ops::MulKernel<paddle::platform::GPUPlace, float>);
+REGISTER_OP_GPU_KERNEL(mul_grad,
+                       ops::MulGradKernel<paddle::platform::GPUPlace, float>);
--- a/paddle/operators/mul_op.h
+++ b/paddle/operators/mul_op.h
@@ -46,5 +46,33 @@ class MulKernel : public framework::OpKernel {
  }
 };

+template <typename Place, typename T>
+class MulGradKernel : public framework::OpKernel {
+ public:
+  void Compute(const framework::ExecutionContext& ctx) const override {
+    auto* input0 = ctx.Input<Tensor>("X");
+    auto* input1 = ctx.Input<Tensor>("Y");
+    auto* input2 = ctx.Input<Tensor>(framework::GradVarName("Out"));
+
+    auto* output0 = ctx.Output<Tensor>(0);
+    auto* output1 = ctx.Output<Tensor>(1);
+    output0->mutable_data<T>(ctx.GetPlace());
+    output1->mutable_data<T>(ctx.GetPlace());
+
+    auto X = EigenMatrix<T>::From(*input0);
+    auto Y = EigenMatrix<T>::From(*input1);
+    auto dOut = EigenMatrix<T>::From(*input2);
+    auto dX = EigenMatrix<T>::From(*output0);
+    auto dY = EigenMatrix<T>::From(*output1);
+
+    // dX = Out@G * Y'
+    // dY = X' * Out@G
+    auto place = ctx.GetEigenDevice<Place>();
+    // TODO(dzh,qijun) : need transpose feature of blas library
+    // Eigen Tensor does not support it very well
+    // dX.device(place) = dOut.contract(dOut, transpose)
+  }
+};
+
 }  // namespace operators
 }  // namespace paddle
--- a/python/paddle/v2/framework/tests/test_mul_op.py
+++ b/python/paddle/v2/framework/tests/test_mul_op.py
@@ -15,5 +15,7 @@ class TestMulOp(unittest.TestCase):
        self.outputs = {'Out': np.dot(self.inputs['X'], self.inputs['Y'])}


+# TODO(dzh,qijun) : mulgrad test case need transpose feature of blas library
+
 if __name__ == '__main__':
    unittest.main()