fix fused_dropout_add bug (#52644)

5df1296d · Chitsing KUI · GitHub · 61ca8b39 · 5df1296d · 5df1296d
5 changed file
--- a/paddle/phi/api/yaml/fused_backward.yaml
+++ b/paddle/phi/api/yaml/fused_backward.yaml
@@ -9,8 +9,9 @@
  args : (Tensor seed_offset, Tensor out_grad, Scalar p, bool is_test, str mode, bool fix_seed)
  output : Tensor(x_grad), Tensor(y_grad)
  infer_meta :
-    func : GeneralBinaryGradInferMeta
+    func : FusedDropoutAddGradInferMeta
-    param : [out_grad, out_grad]
+    param : [seed_offset, out_grad]
  kernel :
    func : fused_dropout_add_grad
+    data_type : out_grad
  support_dygraph_mode : true
--- a/paddle/phi/infermeta/backward.cc
+++ b/paddle/phi/infermeta/backward.cc
@@ -215,6 +215,19 @@ void FlashAttnGradInferMeta(const MetaTensor& q,
  }
 }
+void FusedDropoutAddGradInferMeta(const MetaTensor& seed_offset,
+                                  const MetaTensor& out_grad,
+                                  MetaTensor* x_grad,
+                                  MetaTensor* y_grad) {
+  if (x_grad != nullptr) {
+    x_grad->share_meta(out_grad);
+  }
+  if (y_grad != nullptr) {
+    y_grad->share_meta(out_grad);
+  }
+}
 void CrossEntropyWithSoftmaxGradInferMeta(const MetaTensor& label,
                                          const MetaTensor& softmax,
                                          const MetaTensor& loss_grad,

--- a/paddle/phi/infermeta/backward.h
+++ b/paddle/phi/infermeta/backward.h
@@ -179,6 +179,11 @@ void FlashAttnGradInferMeta(const MetaTensor& q,
                            MetaTensor* dk,
                            MetaTensor* dv);
+void FusedDropoutAddGradInferMeta(const MetaTensor& seed_offset,
+                                  const MetaTensor& out_grad,
+                                  MetaTensor* x_grad,
+                                  MetaTensor* y_grad);
 void GatherNdGradInferMeta(const MetaTensor& x,
                           const MetaTensor& index,
                           const MetaTensor& out_grad,

--- a/paddle/phi/kernels/fusion/gpu/fused_dropout_add_utils.h
+++ b/paddle/phi/kernels/fusion/gpu/fused_dropout_add_utils.h
@@ -20,7 +20,7 @@ namespace phi {
 namespace fusion {
 template <typename Context>
-static inline std::vector<size_t> GetRandomCudaProp(int numel,
+static inline std::vector<size_t> GetRandomCudaProp(int64_t numel,
                                                    const Context& dev_ctx) {
  constexpr int kVecSize = funcs::uniform_distribution<float>::kReturnsCount;
  auto gpu_config =

--- a/python/paddle/distributed/auto_parallel/utils.py
+++ b/python/paddle/distributed/auto_parallel/utils.py
@@ -1260,6 +1260,7 @@ def set_grad_var_shape(program, dist_context):
                "exp_grad",
                "sigmoid_grad",
                "unsqueeze2_grad",
+                "fused_dropout_add_grad",
            ]
            forward_list = [
                "reshape2",
@@ -1281,6 +1282,7 @@ def set_grad_var_shape(program, dist_context):
                "exp",
                "sigmoid",
                "unsqueeze2",
+                "fused_dropout_add",
            ]
            if op.type in need_set_shape_list:
                for forward_op in block.ops: