StableVicuna:基于RLHF的稳定聊天机器人
StableVicuna是由Stable Diffusion背后的StabilityAI团队推出的首个大规模开源聊天机器人。作为Vicuna v0 13b的升级版,StableVicuna是通过基于人类反馈的强化学习(RLHF)进行指令微调和RLHF训练的LLaMA 130亿模型。
以上内容根据网络公开资料进行编写,如无意中侵犯了某媒体或个人的知识产权,请来信或来电告之,本站将立即给予删除。转载本文需注明出处
©️版权声明:若无特殊声明,本站所有文章版权均归
MeoAI
原创和所有,未经许可,任何个人、媒体、网站、团体不得转载、抄袭或以其他方式复制发表本站内容,或在非我站所属的服务器上建立镜像。否则,我站将依法保留追究相关法律责任的权利。
类似于StableVicuna的AI工具
暂无评论...