19967

苹果大模型MM1入场：参数达到300亿超半数作者是华人

站长网2024-03-15 14:34:160阅

要点:

苹果发布了多模态大型语言模型MM1，参数达到300亿，采用MoE架构，超半数作者为华人。

MM1在模型架构、预训练数据选择和训练方法上进行了详细探讨，并在多项基准测试中表现出竞争力。

MM1的预训练和监督微调结果显示，采用不同的数据和训练策略可以获得更好的性能，MoE模型进一步扩展了潜力。

苹果公司最新发布了一款名为MM1的大型多模态基础模型，拥有300亿参数，采用了MoE架构，并且超过一半的作者是华人。该模型在多模态领域具有重要意义，可能预示着苹果未来推出与此相关的产品。

今年以来，苹果明显加大了对生成式人工智能（GenAI）领域的投入，这一举措体现了苹果在GenAI领域取得重大进展的决心。据悉，苹果一部分转向GenAI的团队原本是从事造车项目的，而如今他们也开始投身于GenAI领域的研发工作。

论文地址:https://arxiv.org/pdf/2403.09611.pdf

MM1的发布引起了广泛关注。据论文介绍，该模型采用了MoE变体，并且在预训练指标和多项多模态基准测试上表现出了领先水平。研究者通过多项消融试验，探讨了模型架构、预训练数据选择以及训练程序等方面的重要性。他们发现，图像分辨率、视觉编码器损失和预训练数据在建模设计中都起着关键作用。

在预训练数据选择方面，研究者发现了几个重要经验:交错数据对提高少样本和纯文本性能有帮助，而字幕数据则对提高零样本性能具有重要作用。

此外，纯文本数据对于提高少样本和纯文本性能同样至关重要。通过合理混合图像和文本数据，可以获得最佳的多模态性能，并保留较强的文本性能。研究者还发现，人工合成数据有助于少样本学习。

最终，研究者确定了MM1的最终配方，包括图像编码器、视觉语言连接器和预训练数据的选择。他们还将LLM的大小扩大到3B、7B和30B个参数，并通过专家混合（MoE）进一步扩展了模型。在监督微调实验中，MM1在多项基准测试上表现出了竞争力，并且MoE模型在几乎所有基准测试中均表现优于密集模型。

MM1的发布标志着苹果在多模态领域的重要进展，也为未来苹果可能推出的相关产品奠定了技术基础。该研究的成果对于推动生成式人工智能领域的发展具有重要意义，值得业界密切关注。

苹果大模型MM1入场参数达到300亿超半数作者是华人

0000

评论列表

共(0)条

相关推荐

站长资讯
Vivaldi 浏览器通过伪装 User-Agent 实现对微软 Bing 聊天的支持
站长之家(ChinaZ.com)6月9日消息:Bing聊天是目前最热门的功能之一。这款由人工智能驱动的聊天机器人利用OpenAI的GPT-4和Bing来回答各种问题和提示。官方正式来说，只能通过MicrosoftEdge浏览器使用Bing聊天。然而，随着Vivaldi浏览器6.1版本的发布，情况有所改变。图片来自Vivaldi
站长网2023-06-09 21:54:39
0001
站长资讯
这届双11，奢侈品只配给年轻人凑单
最近，拉夫劳伦的电商员工，可能经历了冰火两重天，店铺商品被人疯狂抢购后，又立刻遭遇了批量退款;范思哲、Burberry、迪奥等品牌，也有相似境遇。这些奢侈大牌，之所以遇上“渣男渣女”，是因为成了网友反向凑单工具;毕竟，价格适合、退款及时、退货方便的美德，很容易得到省钱达人青睐。
站长网2023-11-10 09:20:18
0000
站长资讯
好用不贵的五款手机，买来使用五年没有问题
对于大部分用户来说，其实使用手机的需求都比较简单，完全没必要购买四五千的旗舰产品，就算是一款2000元左右的机型，只要你对拍照没有过高的要求，买来舒服使用五年也是没有任何问题的。客观地说，如今的中端手机和旗舰手机最大的差距还是拍照，性能、续航、充电甚至屏幕层面都没有特别大的差距，如果你不是拍照爱好者，那2000左右的手机就足够好用了。
站长网2023-05-23 20:18:42
0000
站长资讯
以3D视角洞悉矩阵乘法，这就是AI思考的样子
如果能以3D方式展示矩阵乘法的执行过程，当年学习矩阵乘法时也就不会那么吃力了。现如今，矩阵乘法已经成为机器学习模型的构建模块，是各种强大AI技术的基础，了解其执行方式必然有助于我们更深入地理解这个AI以及这个日趋智能化的世界。这篇来自PyTorch博客的文章将介绍一种用于矩阵乘法和矩阵乘法组合的可视化工具mm。
站长网2023-10-02 09:51:34
0002
站长资讯
工信部：加快打造从服务器、网络设备到数据加工、数据治理再到人工智能、模型训练的算力产业链条
在2023中国算力大会新闻发布会上，工信部信息通信发展司司长谢存介绍，下一步，将以本次算力大会和第二届「西部数谷」算力产业大会为契机，在工信部等国家部委的指导支持下，抢抓国家「东数西算」重大机遇，以建设黄河流域生态保护和高质量发展先行区为牵引，努力打造千亿级数字产业集群，使之成为宁夏高质量发展的新增长极。重点是打造好「一群三基地」：
站长网2023-07-18 00:04:33
0001