苹果大模型MM1入场:参数达到300亿 超半数作者是华人
要点:
苹果发布了多模态大型语言模型MM1,参数达到300亿,采用MoE架构,超半数作者为华人。
MM1在模型架构、预训练数据选择和训练方法上进行了详细探讨,并在多项基准测试中表现出竞争力。
MM1的预训练和监督微调结果显示,采用不同的数据和训练策略可以获得更好的性能,MoE模型进一步扩展了潜力。
苹果公司最新发布了一款名为MM1的大型多模态基础模型,拥有300亿参数,采用了MoE架构,并且超过一半的作者是华人。该模型在多模态领域具有重要意义,可能预示着苹果未来推出与此相关的产品。
今年以来,苹果明显加大了对生成式人工智能(GenAI)领域的投入,这一举措体现了苹果在GenAI领域取得重大进展的决心。据悉,苹果一部分转向GenAI的团队原本是从事造车项目的,而如今他们也开始投身于GenAI领域的研发工作。
论文地址:https://arxiv.org/pdf/2403.09611.pdf
MM1的发布引起了广泛关注。据论文介绍,该模型采用了MoE变体,并且在预训练指标和多项多模态基准测试上表现出了领先水平。研究者通过多项消融试验,探讨了模型架构、预训练数据选择以及训练程序等方面的重要性。他们发现,图像分辨率、视觉编码器损失和预训练数据在建模设计中都起着关键作用。
在预训练数据选择方面,研究者发现了几个重要经验:交错数据对提高少样本和纯文本性能有帮助,而字幕数据则对提高零样本性能具有重要作用。
此外,纯文本数据对于提高少样本和纯文本性能同样至关重要。通过合理混合图像和文本数据,可以获得最佳的多模态性能,并保留较强的文本性能。研究者还发现,人工合成数据有助于少样本学习。
最终,研究者确定了MM1的最终配方,包括图像编码器、视觉语言连接器和预训练数据的选择。他们还将LLM的大小扩大到3B、7B和30B个参数,并通过专家混合(MoE)进一步扩展了模型。在监督微调实验中,MM1在多项基准测试上表现出了竞争力,并且MoE模型在几乎所有基准测试中均表现优于密集模型。
MM1的发布标志着苹果在多模态领域的重要进展,也为未来苹果可能推出的相关产品奠定了技术基础。该研究的成果对于推动生成式人工智能领域的发展具有重要意义,值得业界密切关注。
网站可以阻止OpenAI网络爬虫 避免数据用于训练 GPT 模型
本文概要:1.OpenAI现允许网站屏蔽其网络爬虫,以防止其抓取网站内容训练GPT模型的。2.阻止GPTBot可能是OpenAI允许互联网用户选择不让其数据用于训练其大型语言模型的第一步。3.在获取用于训练AI的数据方面存在争议,一些网站和作者提出限制AI公司使用其内容的要求。站长网2023-08-08 10:01:430001和GPT-4这些大模型玩狼人杀,人类因太蠢被票死,真·反向图灵测试
「你看,人类一败涂地了」这是一次「反向图灵测试」,几个全球最先进的大模型坐在一起,坐着火车唱着歌,但其中混进了人类:而AI的任务,是把这个人类揪出来。最近,一位昵称「ToreKnabe」的网友在X平台发布的一段视频引发了人们的讨论。在视频中,四个AINPC与一个人类坐在一起,按照「乘务员」的要求互相试探,找出其中隐藏的人类。其中每一个NPC都对应着一款大模型。站长网2024-05-29 19:32:140000亚运开幕式现场万人AR互动创纪录! 支付宝AI+AR技术融合立大功
9月23日晚,杭州第19届亚运会开幕式精彩呈现,向世界奉献了一场精彩绝伦的视觉盛宴,数实融合成为最大亮点。作为亚运官方合作伙伴、技术服务方的支付宝用技术助力开幕式首创了数实融合、人人可参与的两大经典时刻:超1亿数字火炬手跑出支付宝App汇聚大莲花点燃主火炬,实现全球首个数字点火仪式;万名观众在现场通过支付宝放飞许愿灯召唤吉祥物,实现全球首次大型演出AR互动创举。10个数字,揭秘2大经典时刻站长网2023-09-23 23:07:190000不止图片生成excel 微信还有这三大绝技
快科技9月2日消息,微信图片可以生成excel今天引发网友关注。据悉,微信上接到或者发送出去的表格图片,其实可以通过长按--搜一搜的操作,一键生成Excel表格,这样仅需要进行简单排版就能制作出一张表格了。其实,这是腾讯文档和微信联合推出的功能,双方还推出了众多宝藏功能,包括图片转文档和PDF、永久保存公众号文章、聊天文件转存等等。站长网2023-09-03 08:52:460000微软与AI数据分析公司Synthetaic 签署新合作伙伴关系
文章概要:1.Synthetaic是一家专门从事地理空间数据分析的初创公司,它将获得近100万小时的MicrosoftAzure云计算资源。2.Synthetaic将与MicrosoftAzureSpace合作,提供新解决方案来处理地理空间、静态和视频图像数据。站长网2023-08-31 11:36:040000