fix bug for fused_linear_grad_add and main_grad (#56030) (#56071)

6131aebc · Yuang Liu · GitHub · 5d991c6f · 6131aebc
隐藏空白更改
内联并排

Showing with 11 addition and 9 deletion

python/paddle/distributed/fleet/utils/mix_precision_utils.py python/paddle/distributed/fleet/utils/mix_precision_utils.py +11 -9

未找到文件。
--- a/python/paddle/distributed/fleet/utils/mix_precision_utils.py
+++ b/python/paddle/distributed/fleet/utils/mix_precision_utils.py
@@ -55,16 +55,18 @@ class MixPrecisionLayer(nn.Layer):
            ), "In main_grad node, param.grad should be None, but find param[{}] has grad.".format(
                param.name
            )
-            if param.main_grad is None:
-                param.main_grad = core.eager.Tensor(
-                    value=tmp_grad.cast(paddle.float32).value(),
-                    place=tmp_grad.place,
-                    name="main_grad@" + param.name,
-                )
-            else:
-                param.main_grad.add_(tmp_grad)
+            if tmp_grad._is_initialized():
+                # Some previous pylayer may return None, should check grad validation.
+                if param.main_grad is None:
+                    param.main_grad = core.eager.Tensor(
+                        value=tmp_grad.cast(paddle.float32).value(),
+                        place=tmp_grad.place,
+                        name="main_grad@" + param.name,
+                    )
+                else:
+                    param.main_grad.add_(tmp_grad)

-            tmp_grad._clear_data()
+                tmp_grad._clear_data()
            return None

        return param_hook