zero/mics.py: use on_accelerator instead of cuda only (#3806)

Co-authored-by: N Olatunji Ruwase <olruwase@microsoft.com>

zero/mics.py: use on_accelerator instead of cuda only (#3806)
Co-authored-by: N Olatunji Ruwase <olruwase@microsoft.com>
b4626194 · 郭叶军 · GitHub · f8551b43 · b4626194
隐藏空白更改
内联并排

Showing with 2 addition and 1 deletion

deepspeed/runtime/zero/mics.py deepspeed/runtime/zero/mics.py +2 -1

未找到文件。
--- a/deepspeed/runtime/zero/mics.py
+++ b/deepspeed/runtime/zero/mics.py
@@ -17,6 +17,7 @@ from deepspeed.runtime.zero.parameter_offload import (DeepSpeedZeRoOffload, is_z
 from deepspeed.runtime.zero.partition_parameters import Init, AllGatherCoalescedHandle, ZeroParamStatus
 from deepspeed.runtime.zero.stage3 import DeepSpeedZeroOptimizer_Stage3
 from deepspeed.utils import instrument_w_nvtx, log_dist
+from deepspeed.accelerator import get_accelerator
 from torch import Tensor
 from torch.nn import Parameter

@@ -443,7 +444,7 @@ class MiCS_Optimizer(DeepSpeedZeroOptimizer_Stage3):

        if param_repli_size is None or param_repli_size <= 1:
            return
-        if not partitioned_grads_buffers[0].is_cuda:
+        if not get_accelerator().on_accelerator(partitioned_grads_buffers[0]):
            raise RuntimeError("Local sharding has no support for CPU offloading")

        if dist.has_all_reduce_coalesced():