登陆注册

RLHF再也不需要人类了

  • RLHF再也不需要人类了!谷歌团队研究证明,AI标注已达人类水平

    【新智元导读】ChatGPT横空出世后,RLHF成为研究人员关注的焦点。谷歌最新研究提出,不用人类标注,AI标注偏好后,也能取得与RLHF一样的效果。如果说,RLHF中的「人类」被取代,可行吗?谷歌团队的最新研究提出了,用大模型替代人类,进行偏好标注,也就是AI反馈强化学习(RLAIF)。论文地址:https://arxiv.org/abs/2309.00267
    站长网2023-09-05 14:18:06
    0000