diff --git a/README.md b/README.md index 57cd884026b50608e72805e727dd6e92620a744a..2a2ecedc767d7adcb65b777d01cf98ec5d4fea98 100644 --- a/README.md +++ b/README.md @@ -6,6 +6,7 @@ ChatCSDN基于RWKV1.5B基模型 原始模型参数地址:https://huggingface.co/BlinkDL/rwkv-4-pile-1b5 微调后的模型参数地址:https://huggingface.co/zxm2023/ChatCSDN 介绍博客地址:https://blog.csdn.net/zxm2015/article/details/130227450 +人类反馈强化学习 (RLHF):https://blog.csdn.net/u010280923/article/details/130283628 ## 硬件需求 训练时采用的机器配置: