登陆注册

多项理解任务刷新SOTA

  • 谷歌发布最新「读屏」AI!PaLM 2-S自动生成数据,多项理解任务刷新SOTA

    【新智元导读】谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。每个人想要的大模型,是真·智能的那种......这不,谷歌团队就做出来了一个强大的「读屏」AI。研究人员将其称为ScreenAI,是一种理解用户界面和信息图表的全新视觉语言模型。
    站长网2024-03-05 15:30:56
    0000