add whole dimention case

test=develop

add whole dimention case
test=develop
62257e33 · alinag · c31afacb · 62257e33 · 62257e33 · 62257e33
Showing with 49 addition and 16 deletion

lite/kernels/x86/reduce_compute.h lite/kernels/x86/reduce_compute.h +42 -9

lite/kernels/x86/reduce_op_function.h lite/kernels/x86/reduce_op_function.h +1 -1

lite/operators/conv_op.cc lite/operators/conv_op.cc +6 -6

未找到文件。
--- a/lite/kernels/x86/reduce_compute.h
+++ b/lite/kernels/x86/reduce_compute.h
@@ -25,16 +25,49 @@ namespace kernels {
 namespace x86 {

 struct SumFunctor {
-  template <typename X, typename Y, typename Dim>
-  void operator()(X* x, Y* y, const Dim& dim, size_t d, size_t r_d) {
-    for (int i = 0; i < dim[0]; i++) {
-      for (int k = 0; k < dim[2]; k++) {
-        auto output_temp = x[i * dim[1] * dim[2] + k];
-        for (int j = 1; j < dim[1]; j++) {
-          int input_d = i * dim[1] * dim[2] + j * dim[2] + k;
-          output_temp = output_temp + x[input_d];
+  template <typename X, typename Y, typename XDim, typename Dim>
+  void operator()(X* x, Y* y, const XDim& x_dim, const Dim& dims) {
+    if (dims[0] == 0) {
+      size_t h_size = x_dim[2];
+      size_t w_size = x_dim[1] * x_dim[2];
+      for (int i = 0; i < x_dim[1]; i++) {
+        for (int k = 0; k < x_dim[2]; k++) {
+          auto input_size = i * h_size + k;
+          auto output_temp = x[input_size];
+          for (int j = 1; j < x_dim[0]; j++) {
+            int input_d = input_size + j * w_size;
+            output_temp = output_temp + x[input_d];
+          }
+          y[i * h_size + k] = output_temp;
+        }
+      }
+    } else if (dims[0] == 1) {
+      size_t h_size = x_dim[1] * x_dim[2];
+      size_t w_size = x_dim[2];
+      for (int i = 0; i < x_dim[0]; i++) {
+        for (int k = 0; k < x_dim[2]; k++) {
+          auto input_size = i * h_size + k;
+          auto output_temp = x[input_size];
+          for (int j = 1; j < x_dim[1]; j++) {
+            int input_d = input_size + j * w_size;
+            output_temp = output_temp + x[input_d];
+          }
+          y[i * w_size + k] = output_temp;
+        }
+      }
+    } else {
+      size_t h_size = x_dim[1] * x_dim[2];
+      size_t w_size = x_dim[2];
+      for (int i = 0; i < x_dim[0]; i++) {
+        for (int k = 0; k < x_dim[1]; k++) {
+          auto input_size = i * h_size + k * w_size;
+          auto output_temp = x[input_size];
+          for (int j = 1; j < x_dim[2]; j++) {
+            int input_d = input_size + j;
+            output_temp = output_temp + x[input_d];
+          }
+          y[i * x_dim[1] + k] = output_temp;
        }
-        y[i * dim[2] + k] = output_temp;
      }
    }
  }

--- a/lite/kernels/x86/reduce_op_function.h
+++ b/lite/kernels/x86/reduce_op_function.h
@@ -92,7 +92,7 @@ void ReduceFunctorTensor(const lite::Tensor& input,
  Functor functor;
  const T* input_data = input.data<T>();
  T* output_data = output->mutable_data<T>();
-  functor(input_data, output_data, input.dims(), D, R_D);
+  functor(input_data, output_data, input.dims(), dims);
 }

 }  // namespace x86

--- a/lite/operators/conv_op.cc
+++ b/lite/operators/conv_op.cc
@@ -52,12 +52,12 @@ inline int ConvOutputSize(int input_size,
  return output_size;
 }

-inline void UpdatePaddingAndDilation(std::vector<int>* paddings,
-                                     std::vector<int>* dilations,
-                                     const std::vector<int>& strides,
-                                     const std::string padding_algorithm,
-                                     const lite::DDim data_dims,
-                                     const lite::DDim& ksize) {
+void UpdatePaddingAndDilation(std::vector<int>* paddings,
+                              std::vector<int>* dilations,
+                              const std::vector<int>& strides,
+                              const std::string padding_algorithm,
+                              const lite::DDim data_dims,
+                              const lite::DDim& ksize) {
  // when padding_desc is "VALID" or "SAME"
  if (padding_algorithm == "SAME") {
    for (size_t i = 0; i < strides.size(); ++i) {