登陆注册

Rider

  • 北大&智源提出训练框架LLaMA-Rider 让大模型自主探索开放世界

    要点:1.LLaMA-Rider是一个训练框架,赋予大型语言模型在开放世界中自主探索、学习任务的能力,提高其适应开放环境的通用智能。2.LLaMA-Rider采用反馈-修改机制进行主动探索,在探索阶段将成功经验整合为监督数据集,然后用于微调模型,提高多任务解决的能力。
    站长网2023-11-07 12:06:10
    0000