Follow comments

db175755 · liaogang · 5a1e7dbc · db175755 · db175755 · db175755
8 changed file
--- a/paddle/cuda/src/hl_cuda_cnn.cu
+++ b/paddle/cuda/src/hl_cuda_cnn.cu
@@ -532,8 +532,7 @@ void hl_CMRNorm_backward(size_t frameCnt, const real* inV,
  CHECK_SYNC("hl_CMRNorm_backward");
 }

-__global__ void KeBilinearInterpFw(const size_t nthreads,
-                                   const real* in,
+__global__ void KeBilinearInterpFw(const real* in,
                                   const size_t inImgH,
                                   const size_t inImgW,
                                   const size_t inputH,
@@ -546,6 +545,7 @@ __global__ void KeBilinearInterpFw(const size_t nthreads,
                                   const size_t numChannels,
                                   const real ratioH,
                                   const real ratioW) {
+  int nthreads = outputH * outputW;                      
  int tid = blockIdx.x * blockDim.x + threadIdx.x;
  if (tid < nthreads) {
    int outIdH = tid / outputW;
@@ -593,13 +593,12 @@ void hl_bilinear_forward(const real* inData,
  int blocks = (threadNum + 1024 - 1) / 1024;

  KeBilinearInterpFw<<< blocks, 1024, 0, STREAM_DEFAULT>>>(
-    threadNum, inData, inImgH, inImgW, inputH, inputW, outData,
-    outImgH, outImgW, outputH, outputW, numChannels, ratioH, ratioW);
+    inData, inImgH, inImgW, inputH, inputW, outData, outImgH,
+    outImgW, outputH, outputW, numChannels, ratioH, ratioW);
  CHECK_SYNC("hl_bilinear_forward failed");
 }

-__global__ void KeBilinearInterpBw(const size_t nthreads,
-                                   real* in,
+__global__ void KeBilinearInterpBw(real* in,
                                   const size_t inImgH,
                                   const size_t inImgW,
                                   const size_t inputH,
@@ -612,6 +611,7 @@ __global__ void KeBilinearInterpBw(const size_t nthreads,
                                   const size_t numChannels,
                                   const real ratioH,
                                   const real ratioW) {
+  int nthreads = outputH * outputW;
  int tid = blockIdx.x * blockDim.x + threadIdx.x;
  if (tid < nthreads) {
    int outIdH = tid / outputW;
@@ -659,8 +659,8 @@ void hl_bilinear_backward(real* inGrad,
  int blocks = (threadNum + 1024 - 1) / 1024;

  KeBilinearInterpBw<<< blocks, 1024, 0, STREAM_DEFAULT>>>(
-    threadNum, inGrad, inImgH, inImgW, inputH, inputW, outGrad,
-    outImgH, outImgW, outputH, outputW, numChannels, ratioH, ratioW);
+    inGrad, inImgH, inImgW, inputH, inputW, outGrad, outImgH,
+    outImgW, outputH, outputW, numChannels, ratioH, ratioW);
  CHECK_SYNC("hl_bilinear_backward failed");
 }


--- a/paddle/gserver/layers/BilinearInterpLayer.cpp
+++ b/paddle/gserver/layers/BilinearInterpLayer.cpp
@@ -40,6 +40,11 @@ size_t BilinearInterpLayer::getSize() {
  CHECK(inImgH_ > 0 && inImgW_ > 0);
  CHECK(numChannels_);

+  ratioH_ = (outImgH_ > 1) ?
+    static_cast<real>(inImgH_ - 1) / (outImgH_ - 1) : 0.f;
+  ratioW_ = (outImgW_ > 1) ?
+    static_cast<real>(inImgW_ - 1) / (outImgW_ - 1) : 0.f;
+
  getOutput().setFrameHeight(outImgH_);
  getOutput().setFrameWidth(outImgW_);
  return outImgH_ * outImgW_ * numChannels_;
@@ -70,7 +75,7 @@ void BilinearInterpLayer::forward(PassType passType) {
  {
    REGISTER_TIMER_INFO("FwBilinearInterpTimer", getName().c_str());
    outV->bilinearForward(*inV, inImgH_, inImgW_, outImgH_, outImgW_,
-      numChannels_);
+      numChannels_, ratioH_, ratioW_);
  }
 }

@@ -83,7 +88,7 @@ void BilinearInterpLayer::backward(const UpdateCallback& callback) {
    REGISTER_TIMER_INFO("BwBilinearInterpTimer", getName().c_str());
    if (inputG) {
      inputG->bilinearBackward(*outG, outImgH_, outImgW_, inImgH_, inImgW_,
-        numChannels_);
+        numChannels_, ratioH_, ratioW_);
    }
  }
 }

--- a/paddle/gserver/layers/BilinearInterpLayer.h
+++ b/paddle/gserver/layers/BilinearInterpLayer.h
@@ -29,6 +29,7 @@ class BilinearInterpLayer : public Layer {
 protected:
  size_t outImgH_, outImgW_;
  size_t inImgH_, inImgW_;
+  real ratioH_, ratioW_;
  size_t numChannels_;

 public:

--- a/paddle/gserver/tests/test_LayerGrad.cpp
+++ b/paddle/gserver/tests/test_LayerGrad.cpp
@@ -50,6 +50,16 @@ TEST(Layer, BilinearInterpLayer) {
  for (auto useGpu : {false, true}) {
    testLayerGrad(config, "bilinear_interp", 10, false, useGpu);
  }
+
+  bilinear->set_img_size_x(32);
+  bilinear->set_img_size_y(32);
+  bilinear->set_out_size_x(32);
+  bilinear->set_out_size_y(32);
+  bilinear->set_num_channels(4);
+
+  for (auto useGpu : {false, true}) {
+    testLayerGrad(config, "bilinear_interp", 10, false, useGpu);
+  }
 }

 TEST(Operator, dot_mul) {

--- a/paddle/math/Matrix.cpp
+++ b/paddle/math/Matrix.cpp
@@ -1227,7 +1227,9 @@ void GpuMatrix::bilinearForward(const Matrix& in,
                                const size_t inImgW,
                                const size_t outImgH,
                                const size_t outImgW,
-                                const size_t numChannels) {
+                                const size_t numChannels,
+                                const real ratioH,
+                                const real ratioW) {
  CHECK(dynamic_cast<const GpuMatrix*>(&in));

  const size_t outputW = getWidth();
@@ -1238,11 +1240,6 @@ void GpuMatrix::bilinearForward(const Matrix& in,
  real* outData = getData();
  const real* inData  = in.getData();

-  real ratioH = (outImgH > 1) ?
-      static_cast<real>(inImgH - 1) / (outImgH - 1) : 0.f;
-  real ratioW = (outImgW > 1) ?
-      static_cast<real>(inImgW - 1) / (outImgW - 1) : 0.f;
-
  if (inImgH == outImgW && inImgW == outImgW) {
    this->copyFrom(in);
  } else {
@@ -1258,7 +1255,9 @@ void GpuMatrix::bilinearBackward(const Matrix& out,
                                 const size_t outImgW,
                                 const size_t inImgH,
                                 const size_t inImgW,
-                                 const size_t numChannels) {
+                                 const size_t numChannels,
+                                 const real ratioH,
+                                 const real ratioW) {
  CHECK(dynamic_cast<const GpuMatrix*>(&out));

  const size_t inputW = getWidth();
@@ -1269,13 +1268,8 @@ void GpuMatrix::bilinearBackward(const Matrix& out,
  real* inGrad = getData();
  const real* outGrad = out.getData();

-  real ratioH = (outImgH > 1) ?
-      static_cast<real>(inImgH - 1) / (outImgH - 1) : 0.f;
-  real ratioW = (outImgW > 1) ?
-      static_cast<real>(inImgW - 1) / (outImgW - 1) : 0.f;
-
  if (outImgH == inImgH && outImgW == inImgW) {
-    this->addBias(const_cast<Matrix&>(out), 1.f);
+    this->add(const_cast<Matrix&>(out));
  } else {
    hl_bilinear_backward(
      inGrad, inImgH, inImgW, inputH, inputW, outGrad,
@@ -3908,7 +3902,9 @@ void CpuMatrix::bilinearForward(const Matrix& in,
                                const size_t inImgW,
                                const size_t outImgH,
                                const size_t outImgW,
-                                const size_t numChannels) {
+                                const size_t numChannels,
+                                const real ratioH,
+                                const real ratioW) {
  CHECK(dynamic_cast<const CpuMatrix*>(&in));

  size_t outputW = getWidth();
@@ -3920,11 +3916,6 @@ void CpuMatrix::bilinearForward(const Matrix& in,
  real* outData = getData();
  const real* inData  = in.getData();

-  const real ratioH = (outImgH > 1) ?
-    static_cast<real>(inImgH - 1) / (outImgH - 1) : 0.f;
-  const real ratioW = (outImgW > 1) ?
-    static_cast<real>(inImgW - 1) / (outImgW - 1) : 0.f;
-
  if (inImgH == outImgH && inImgW == outImgW) {
    this->copyFrom(in);
  } else {
@@ -3932,21 +3923,23 @@ void CpuMatrix::bilinearForward(const Matrix& in,
      for (size_t i = 0; i < outImgH; ++i) {  // loop for images
        size_t h = ratioH * i;
        size_t hid = (h < inImgH - 1) ? 1 : 0;
-        real hlambda = ratioH * i - h;
+        real h1lambda = ratioH * i - h;
+        real h2lambda = 1 - h1lambda;

        for (size_t j = 0; j < outImgW; ++j) {
          size_t w = ratioW * j;
          size_t wid = (w < inImgW - 1) ? 1 : 0;
-          real wlambda = ratioW * j - w;
+          real w1lambda = ratioW * j - w;
+          real w2lambda = 1 - w1lambda;
          // calculate four position for bilinear interpolation
          const real* inPos = &inData[k * inputW + h * inImgW + w];
          real* outPos = &outData[k * outputW + i * outImgW + j];
          for (size_t c = 0; c < numChannels; ++c) {  // loop for channels
            // bilinear interpolation
-            outPos[0] = (1.f - hlambda) *
-              ((1.f - wlambda) * inPos[0] + wlambda * inPos[wid]) +
-              hlambda * ((1.f - wlambda) * inPos[hid * inImgW] +
-              wlambda * inPos[hid * inImgW + wid]);
+            outPos[0] =
+              h2lambda * (w2lambda * inPos[0] + w1lambda * inPos[wid]) +
+              h1lambda * (w2lambda * inPos[hid * inImgW] +
+              w1lambda * inPos[hid * inImgW + wid]);
            inPos += inImgH * inImgW;
            outPos += outImgH * outImgW;
          }
@@ -3961,7 +3954,9 @@ void CpuMatrix::bilinearBackward(const Matrix& out,
                                 const size_t outImgW,
                                 const size_t inImgH,
                                 const size_t inImgW,
-                                 const size_t numChannels) {
+                                 const size_t numChannels,
+                                 const real ratioH,
+                                 const real ratioW) {
  CHECK(dynamic_cast<const CpuMatrix*>(&out));

  size_t inputW = getWidth();
@@ -3973,32 +3968,28 @@ void CpuMatrix::bilinearBackward(const Matrix& out,
  real* inGrad = getData();
  const real* outGrad = out.getData();

-  const real ratioH = (outImgH > 1) ?
-    static_cast<real>(inImgH - 1) / (outImgH - 1) : 0.f;
-  const real ratioW = (outImgW > 1) ?
-    static_cast<real>(inImgW - 1) / (outImgW - 1) : 0.f;
-
  if (inImgH == outImgH && inImgW == outImgW) {
-    this->addBias(const_cast<Matrix&>(out), 1.f);
+    this->add(const_cast<Matrix&>(out));
  } else {
    for (size_t k = 0; k < batchSize; ++k) {   // loop for batches
      for (size_t i = 0; i < outImgH; ++i) {  // loop for images
        size_t h = ratioH * i;
        size_t hid = (h < inImgH - 1) ? 1 : 0;
-        real hlambda = ratioH * i - h;
-
+        real h1lambda = ratioH * i - h;
+        real h2lambda = 1 - h1lambda;
        for (size_t j = 0; j < outImgW; ++j) {
          size_t w = ratioW * j;
          size_t wid = (w < inImgW - 1) ? 1 : 0;
-          real wlambda = ratioW * j - w;
+          real w1lambda = ratioW * j - w;
+          real w2lambda = 1 - w1lambda;

          real* inPos = &inGrad[k * inputW + h * inImgW + w];
          const real* outPos = &outGrad[k * outputW + i * outImgW + j];
          for (size_t c = 0; c < numChannels; ++c) {  // loop for channels
-            inPos[0] += (1.f - hlambda) * (1.f - wlambda) * outPos[0];
-            inPos[wid] += (1.f - hlambda) * wlambda * outPos[0];
-            inPos[hid * inImgW] += hlambda * (1.f - wlambda) * outPos[0];
-            inPos[hid * inImgW + wid] += hlambda * wlambda * outPos[0];
+            inPos[0] += h2lambda * w2lambda * outPos[0];
+            inPos[wid] += h2lambda * w1lambda * outPos[0];
+            inPos[hid * inImgW] += h1lambda * w2lambda * outPos[0];
+            inPos[hid * inImgW + wid] += h1lambda * w1lambda * outPos[0];
            inPos += inImgH * inImgW;
            outPos += outImgH * outImgW;
          }

--- a/paddle/math/Matrix.h
+++ b/paddle/math/Matrix.h
@@ -997,7 +997,9 @@ public:
                               const size_t inImgW,
                               const size_t outImgH,
                               const size_t outImgW,
-                               const size_t numChannels) {
+                               const size_t numChannels,
+                               const real ratioH,
+                               const real ratioW) {
    LOG(FATAL) << "Not implemented";
  }
  virtual void bilinearBackward(const Matrix& out,
@@ -1005,7 +1007,9 @@ public:
                                const size_t outImgW,
                                const size_t inImgH,
                                const size_t inImgW,
-                                const size_t numChannels) {
+                                const size_t numChannels,
+                                const real ratioH,
+                                const real ratioW) {
    LOG(FATAL) << "Not implemented";
  }
 };
@@ -1283,14 +1287,18 @@ public:
                       const size_t inImgW,
                       const size_t outImgH,
                       const size_t outImgW,
-                       const size_t numChannels);
+                       const size_t numChannels,
+                       const real ratioH,
+                       const real ratioW);

  void bilinearBackward(const Matrix& out,
                        const size_t outImgH,
                        const size_t outImgW,
                        const size_t inImgH,
                        const size_t inImgW,
-                        const size_t numChannels);
+                        const size_t numChannels,
+                        const real ratioH,
+                        const real ratioW);
 };

 class CpuMatrix : public Matrix {
@@ -1583,14 +1591,18 @@ public:
                       const size_t inImgW,
                       const size_t outImgH,
                       const size_t outImgW,
-                       const size_t numChannels);
+                       const size_t numChannels,
+                       const real ratioH,
+                       const real ratioW);

  void bilinearBackward(const Matrix& out,
                        const size_t outImgH,
                        const size_t outImgW,
                        const size_t inImgH,
                        const size_t inImgW,
-                        const size_t numChannels);
+                        const size_t numChannels,
+                        const real ratioH,
+                        const real ratioW);
 };

 class SharedCpuMatrix : public CpuMatrix {

--- a/paddle/math/tests/test_matrixCompare.cpp
+++ b/paddle/math/tests/test_matrixCompare.cpp
@@ -94,7 +94,8 @@ void testBilinearFwdBwd(int numSamples, int imgSizeH, int imgSizeW,
                        int channels) {
  int inWidth = imgSizeH * imgSizeW * channels;
  int outWidth = 2 * imgSizeH * 2 * imgSizeW * channels;
-
+  real ratioH = 0.5;
+  real ratioW = 0.5;
  // forward
  MatrixPtr input = CpuMatrix::create(numSamples, inWidth, false, false);
  MatrixPtr inputGpu = GpuMatrix::create(numSamples, inWidth, false, true);
@@ -107,9 +108,9 @@ void testBilinearFwdBwd(int numSamples, int imgSizeH, int imgSizeW,
  inputGpu->copyFrom(*input);

  target->bilinearForward(*input, imgSizeH, imgSizeW,
-      2 * imgSizeH, 2 * imgSizeW, channels);
+      2 * imgSizeH, 2 * imgSizeW, channels, ratioH, ratioW);
  targetGpu->bilinearForward(*inputGpu, imgSizeH, imgSizeW,
-      2 * imgSizeH, 2 * imgSizeW, channels);
+      2 * imgSizeH, 2 * imgSizeW, channels, ratioH, ratioW);

  // check
  targetCheck->copyFrom(*targetGpu);
@@ -131,9 +132,9 @@ void testBilinearFwdBwd(int numSamples, int imgSizeH, int imgSizeW,
  targetGpuGrad->copyFrom(*targetGrad);

  inputGrad->bilinearBackward(*targetGrad, 2 * imgSizeH, 2 * imgSizeW,
-      imgSizeH, imgSizeW, channels);
+      imgSizeH, imgSizeW, channels, ratioH, ratioW);
  inputGpuGrad->bilinearBackward(*targetGpuGrad, 2 * imgSizeH, 2 * imgSizeW,
-      imgSizeH, imgSizeW, channels);
+      imgSizeH, imgSizeW, channels, ratioH, ratioW);

  // check
  targetCheckGrad->copyFrom(*inputGpuGrad);

--- a/python/paddle/trainer_config_helpers/layers.py
+++ b/python/paddle/trainer_config_helpers/layers.py
@@ -1272,19 +1272,17 @@ def bilinear_interp_layer(input,

    .. code-block:: python

-       bilinear = bilinear_interp_layer(input,
-                                        out_size_x,
-                                        out_size_y)
+       bilinear = bilinear_interp_layer(input=layer1, out_size_x=64, out_size_y=64)
    
-    :para    input:        A input layer.
+    :param   input:        A input layer.
    :type    input:        LayerOutput.
-    :para    out_size_x:   bilinear interpolation output width.
+    :param   out_size_x:   bilinear interpolation output width.
    :type    out_size_x:   int|None 
-    :para    out_size_y:   bilinear interpolation output height.
+    :param   out_size_y:   bilinear interpolation output height.
    :type    out_size_y:   int|None
-    :para    name:         The layer's name, which cna not be specified.
+    :param   name:         The layer's name, which cna not be specified.
    :type    name:         None|basestring
-    :para    layer_attr:   Extra Layer attribute.
+    :param   layer_attr:   Extra Layer attribute.
    :type    layer_attr:   ExtraLayerAttribute
    :return: LayerOutput object.
    :rtype:  LayerOutput
@@ -1301,7 +1299,8 @@ def bilinear_interp_layer(input,
                                                      num_channels=num_channels)),
          type=LayerType.BILINEAR_INTERP_LAYER,
          **ExtraLayerAttribute.to_kwargs(layer_attr))
-    return LayerOutput(name, LayerType.BILINEAR_INTERP_LAYER, parents=[input])
+    return LayerOutput(name, LayerType.BILINEAR_INTERP_LAYER, parents=[input],
+           num_filters=num_channels)

 @wrap_name_default()
 @layer_support()