Handle Norm allreduce when no mp (#1021)

Co-authored-by: N Jeff Rasley <jerasley@microsoft.com>

Handle Norm allreduce when no mp (#1021)
Co-authored-by: N Jeff Rasley <jerasley@microsoft.com>
429dfa6c · Olatunji Ruwase · GitHub · dad26428 · 429dfa6c
隐藏空白更改
内联并排

Showing with 1 addition and 1 deletion

deepspeed/runtime/zero/stage3.py deepspeed/runtime/zero/stage3.py +1 -1

未找到文件。
--- a/deepspeed/runtime/zero/stage3.py
+++ b/deepspeed/runtime/zero/stage3.py
@@ -2405,7 +2405,7 @@ class FP16_DeepSpeedZeroOptimizer_Stage3(object):
        """ Perform all reduce within model parallel group, if any.
        """
        if self.model_parallel_group is None:
-            torch.distributed.all_reduce(tensor=tensor, op=op)
+            pass
        else:
            torch.distributed.all_reduce(tensor=tensor,
                                         op=op,