fix the shape choose of vectorize for cuda

068d905e · wangchaochaohu · GitHub · a0b60716 · 068d905e
显示空白变更内容
内联并排

Showing with 1 addition and 1 deletion

paddle/fluid/operators/elementwise/elementwise_add_op.h paddle/fluid/operators/elementwise/elementwise_add_op.h +1 -1

未找到文件。
--- a/paddle/fluid/operators/elementwise/elementwise_add_op.h
+++ b/paddle/fluid/operators/elementwise/elementwise_add_op.h
@@ -348,7 +348,7 @@ class ElementwiseAddGradKernel : public ElemwiseGradKernel<T> {
      } else {
        size_t thread_nums = 1024;
        size_t block_nums = (width + thread_nums - 1) / thread_nums;
-        int vec_size = VectorizedSize<T>(dx_data);
+        int vec_size = VectorizedSize<T>(dout_data);
        if (vec_size == 4 && width % 4 == 0) {
          block_nums = (width / vec_size + thread_nums - 1) / thread_nums;
          VecMatrixReduceLongWidth<T,