opt reward model

6e8dbe4b · u010280923 · 60942751 · 6e8dbe4b
隐藏空白更改
内联并排

Showing with 1 addition and 1 deletion

src/rlhf/reward.py src/rlhf/reward.py +1 -1

未找到文件。
--- a/src/rlhf/reward.py
+++ b/src/rlhf/reward.py
@@ -136,7 +136,7 @@ class RewardModel(pl.LightningModule):
        strategy = self.trainer.strategy
        if isinstance(strategy, DeepSpeedStrategy):
            cfg = strategy.config["zero_optimization"]
-            return cfg.get("offload_optimizer") or cfg.get("offload_param")
+            return bool(cfg.get("offload_optimizer") or cfg.get("offload_param"))
        return False

    def single_forward(