登陆注册

统一强化学习智能体

  • 伦敦帝国理工学院和 DeepMind联合设计AI框架 统一强化学习智能体

    伦敦帝国理工学院和DeepMind的研究人员设计了一个AI框架,将语言作为强化学习智能体的核心推理工具。该框架利用了大型语言模型和视觉语言模型,能够有效解决强化学习中的几个基本问题,包括在奖励稀疏环境中的高效探索、顺序学习中的数据重用、新任务的能力调度以及从专家智能体的观察中学习。
    站长网2023-07-28 09:27:48
    0001