From b4626194e4be81c2af20d6fdca8d4771ba34f74e Mon Sep 17 00:00:00 2001
From: Guo Yejun <yejun.guo@intel.com>
Date: Thu, 29 Jun 2023 23:50:56 +0800
Subject: [PATCH] zero/mics.py: use on_accelerator instead of cuda only (#3806)

Co-authored-by: Olatunji Ruwase <olruwase@microsoft.com>
---
 deepspeed/runtime/zero/mics.py | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/deepspeed/runtime/zero/mics.py b/deepspeed/runtime/zero/mics.py
index 6a22b8bc..dcd603ef 100755
--- a/deepspeed/runtime/zero/mics.py
+++ b/deepspeed/runtime/zero/mics.py
@@ -17,6 +17,7 @@ from deepspeed.runtime.zero.parameter_offload import (DeepSpeedZeRoOffload, is_z
 from deepspeed.runtime.zero.partition_parameters import Init, AllGatherCoalescedHandle, ZeroParamStatus
 from deepspeed.runtime.zero.stage3 import DeepSpeedZeroOptimizer_Stage3
 from deepspeed.utils import instrument_w_nvtx, log_dist
+from deepspeed.accelerator import get_accelerator
 from torch import Tensor
 from torch.nn import Parameter
 
@@ -443,7 +444,7 @@ class MiCS_Optimizer(DeepSpeedZeroOptimizer_Stage3):
 
         if param_repli_size is None or param_repli_size <= 1:
             return
-        if not partitioned_grads_buffers[0].is_cuda:
+        if not get_accelerator().on_accelerator(partitioned_grads_buffers[0]):
             raise RuntimeError("Local sharding has no support for CPU offloading")
 
         if dist.has_all_reduce_coalesced():
-- 
GitLab