登陆注册

微调GPT

  • OpenAI开源超级对齐方法:用GPT-2,监督、微调GPT-4

    12月15日,OpenAI在官网公布了最新研究论文和开源项目——如何用小模型监督大模型,实现更好的新型对齐方法。目前,大模型的主流对齐方法是RLHF(人类反馈强化学习)。但随着大模型朝着多模态、AGI发展,神经元变得庞大、复杂且难控制,RLHF便有点力不从心。
    站长网站长资讯2023-12-16 09:38:32
    0002