登陆注册

超半数作者是华人

  • 苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

    苹果也在搞自己的大型多模态基础模型,未来会不会基于该模型推出相应的文生图产品呢?我们拭目以待。今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在2024苹果股东大会上,苹果CEO蒂姆・库克表示,今年将在GenAI领域实现重大进展。此外,苹果宣布放弃10年之久的造车项目之后,一部分造车团队成员也开始转向GenAI。
    站长网2024-03-16 13:45:35
    0002
  • 苹果大模型MM1入场:参数达到300亿 超半数作者是华人

    要点:苹果发布了多模态大型语言模型MM1,参数达到300亿,采用MoE架构,超半数作者为华人。MM1在模型架构、预训练数据选择和训练方法上进行了详细探讨,并在多项基准测试中表现出竞争力。MM1的预训练和监督微调结果显示,采用不同的数据和训练策略可以获得更好的性能,MoE模型进一步扩展了潜力。
    站长网2024-03-15 14:34:16
    0000