fix split_tensor of dp_pp_comm_overlap (#54310)

279ac753 · Haohongxiang · GitHub · 06304ade · 279ac753
隐藏空白更改
内联并排

Showing with 3 addition and 0 deletion

python/paddle/distributed/fleet/meta_parallel/pp_utils/utils.py .../paddle/distributed/fleet/meta_parallel/pp_utils/utils.py +3 -0

未找到文件。
--- a/python/paddle/distributed/fleet/meta_parallel/pp_utils/utils.py
+++ b/python/paddle/distributed/fleet/meta_parallel/pp_utils/utils.py
@@ -20,6 +20,7 @@ import paddle
 from paddle import _legacy_C_ops
 from paddle.distributed.parallel import _split_tensors
 from paddle.fluid import core
+from paddle.framework import base as imperative_base
 __all__ = []
@@ -165,6 +166,7 @@ class FusedAllReduceBuffer:
        if self._all_params_checked_in:
            self._fused_allreduce_grads()
+    @imperative_base.no_grad
    def _fused_allreduce_grads(self):
        assert self._all_params_checked_in
        flattened_vars = []
@@ -188,6 +190,7 @@ class FusedAllReduceBuffer:
                )
            )
+    @imperative_base.no_grad
    def scale_and_split_grads(self):
        for task in self._tasks:
            task.wait()