提交 f851310a 编写于 作者: U u010280923

bug fixed

上级 09fc08b8
...@@ -171,7 +171,6 @@ class RewardModel(pl.LightningModule): ...@@ -171,7 +171,6 @@ class RewardModel(pl.LightningModule):
# 获得最后一个 token 的 embedding # 获得最后一个 token 的 embedding
last_token_embeds = self.rwkv( last_token_embeds = self.rwkv(
x, x,
state=None,
extra_embed=extra_embed, extra_embed=extra_embed,
rm_train=True rm_train=True
)[:, -1, :] )[:, -1, :]
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册