debug

77e4f4cb · u010280923 · 95ea4cd1 · 77e4f4cb
隐藏空白更改
内联并排

Showing with 11 addition and 0 deletion

src/rlhf/reward.py src/rlhf/reward.py +11 -0

未找到文件。
--- a/src/rlhf/reward.py
+++ b/src/rlhf/reward.py
@@ -123,10 +123,21 @@ class RewardModel(pl.LightningModule):
                    {"params": [param_dict[n] for n in lr_2x], "weight_decay": 0.0, "my_lr_scale": 2.0},
                    {"params": [param_dict[n] for n in lr_3x], "weight_decay": 0.0, "my_lr_scale": 3.0},
                ]
+            optim_names = [
+                {"params": lr_1x},
+                {"params": lr_2x},
+                {"params": lr_3x},
+            ]
        else:
            optim_groups = [
                {"params": [p for n, p in self.named_parameters()], "weight_decay": 0.0},
            ]
+            optim_names = [
+                {"params": [n for n, p in self.named_parameters()]},
+            ]
        if self.deepspeed_offload:
            return DeepSpeedCPUAdam(optim_groups, lr=self.args.lr_init, betas=self.args.betas, eps=self.args.adam_eps, bias_correction=True, adamw_mode=False, weight_decay=0, amsgrad=False)