登陆注册

DeepMind研究减少大型语言模型

  • DeepMind研究减少大型语言模型“阿谀奉承”行为

    本文概要:1.大型语言模型容易出现阿谀奉承行为,即模型会修改其响应以与用户观点一致,即使该观点不正确。2.研究人员使用简单的合成数据干预技术成功地减少了阿谀奉承行为。3.研究结果表明,通过简单的合成数据微调可以减少模型重复用户观点的特征。最近,来自GoogleDeepMind的研究人员开展了一项研究,旨在减少大型语言模型(LLM)中的“阿谀奉承”行为。
    站长网2023-08-14 15:22:57
    0000