登陆注册

已学会看图玩扑克

  • 多模态模型再进化,已学会看图玩扑克、算“12点”

    在科技领域,多模态模型的决策能力一直是研究的热点。最近,UC伯克利等高校的研究团队提出了一种名为RL4VLM的全新强化学习框架,成功地提升了多模态大模型在决策任务上的表现。该模型在无需人类反馈的情况下,通过强化学习微调,已经学会了看图玩扑克、算“12点”等任务,并且其表现超越了GPT-4v。
    站长网2024-06-04 17:48:06
    0000