登陆注册

多模态

  • 苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

    苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在2024苹果股东大会上,苹果CEO蒂姆・库克表示,今年将在GenAI领域实现重大进展。此外,苹果宣布放弃10年之久的造车项目之后,一部分造车团队成员也开始转向GenAI。
    站长网2024-03-16 13:45:35
    0002
  • 谷歌“狙击”OpenAI,发布新一代大模型,主打Agent+多模态

    继量子芯片之后,谷歌又来抢“OpenAI双12直播”的流量了!就在刚刚,谷歌新一代大模型Gemini2.0突然登场,再次由谷歌CEO皮猜亲自官宣。新一代模型专为AIAgent而打造,谷歌表示目前已经将2.0版本提供给了一些开发者内测,正在迅速将其集成在Gemini和搜索等产品线中。好消息是,Gemini2.0Flash实验版模型今天就在网页端开放,大家都能玩,移动端即将推出。
    站长网站长资讯2024-12-12 09:23:40
    0000
  • 2023 年最重要的 3 项人工智能创新:多模态 AI、宪法 AI 和文本转视频技术

    站长之家(ChinaZ.com)12月22日消息:2023年,人工智能(AI)领域见证了重大进展,不仅公众对AI有了更深的理解,政府也开始认真对待AI风险。本年度的发展不仅是新技术和理念的出现,更是长期孕育后的集中爆发。以下是过去一年中人工智能领域最重要的三项创新:
    站长网站长资讯2023-12-22 13:05:05
    0000
  • GPT-4完成正确率仅6%,北大等提出首个“多轮、多模态”PPT任务完成基准PPTC

    【新智元导读】为了填补LLM在复杂多模态环境中利用复杂工具完成多轮、多模态指令的评估空白,研究人员引入了PowerPoint任务完成(PPTC)基准测试,以评估LLM创建和编辑PPT文档的能力。
    站长网2023-11-08 15:09:40
    0000
  • 谷歌认真起来,就没 OpenAI 什么事了!创始人亲自组队创建“杀手级”多模态 AI 模型

    谷歌正在计划如何利用即将推出的大型语言模型系列Gemini来取代ChatGPT。截至目前,OpenAI大语言模型在AI竞赛中一直处于领先地位。而强劲优势的背后,离不开微软庞大数据中心基础设施的有力支持。但ChatGPT的主导地位恐怕无法长久持续下去,因为新的、更强大的AI模型正不断涌现,而其中最具战斗力的挑战者就来自谷歌。
    站长网2023-08-19 16:16:06
    0000
  • 字节团队提出猞猁 Lynx 模型 多模态 LLMs 开创理解生成新高度

    字节团队最近提出了一种名为猞猁(Lynx)的多模态大语言模型(LLMs)。他们通过对二十多种多模态LLMs变体进行系统实验和评估,确定了以prefix-finetuning为主要结构的Lynx模型,并且还提出了一个新的多模态评估基准Open-VQA。论文:https://arxiv.org/abs/2307.02469网站:https://lynx-llm.github.io/
    站长网2023-07-18 17:22:58
    0000