Meta 推出基于 token 的全新 AI 图像生成模型 CM3leon:更高效先进
Meta 正在继续推进对新形式生成式人工智能模型的研究,并公布了最新成果,名为 CM3leon(发音类似于「chameleon(变色龙)」)。
图片来自Meta
CM3leon 是一个用于文本到图像创建和图像到文本创建的多模态基础模型,对于自动生成图像标题非常有用。
人工智能生成的图像在当前已经不是新概念,广泛可用的工具如 Stable Diffusion、DALL-E 和 Midjourney 已经取得了很大成功。
新鲜的是 Meta 正在使用构建 CM3leon 的技术以及 Meta 声称该基础模型能够实现的性能。
当前文本到图像生成技术主要依赖 diffusion 模型(Stable Diffusion 的名称源自此)来创建图像。CM3leon 则采用了不同的方法:基于 token 的自回归模型。
Meta 的研究人员在一篇名为《Scaling Autoregressive Multi-Modal Models: Pretraining and Instruction Tuning》的研究论文中写道:「近年来,由于性能强大且相对计算成本较低,diffusion 模型在图像生成工作中占据主导地位。相比之下,众所周知基于 token 的自回归模型也能产生出色的结果,尤其在全局图像连贯性方面更好,但训练和推理的成本要高得多。」
Meta 的研究人员已经能够通过 CM3leon 实际演示基于 token 的自回归模型实际上可以比基于 diffusion 模型的方法更高效。
Meta 的研究人员在一篇博客文章中写道:「尽管使用的计算资源比之前基于Transformer 的方法少了五倍,CM3leon 在文本到图像生成方面实现了最先进的性能。」
CM3leon 的基本工作原理在某种程度上与现有的文本生成模型类似。
Meta 的研究人员首先进行了一个检索增强的预训练阶段。与仅从互联网上收集公开可用的图像不同,这种方法已经给基于 diffusion 模型的模型带来了一些法律挑战,Meta 选择了一条不同的道路。
Meta 的研究论文指出:「在文本到图像生成领域,图像数据来源的道德影响已经引发了广泛的讨论。在本研究中,我们只使用 Shutterstock 上的经过授权的图像。因此,我们可以避免与图像所有权和归属相关的担忧,同时不会牺牲性能。」
在预训练之后,CM3leon 模型经过一阶段有监督微调(SFT),Meta 的研究人员声称这种方法产生了高度优化的结果,无论是资源利用还是图像质量。SFT 是 OpenAI 用于训练 ChatGPT 的一种方法。Meta 在研究论文中指出,SFT 用于训练模型理解复杂提示,在生成任务中非常有用。
论文中指出:「我们发现,指导调整显著提高了多模态模型在图像标题生成、视觉问答、基于文本的编辑和条件图像生成等各种任务中的性能。」
通过查看 Meta 在关于 CM3leon 的博客文章中分享的生成图像样本集,结果令人印象深刻,清楚地显示了模型理解复杂的多阶段提示,从而生成了分辨率极高的图像。
目前,CM3leon 仍然是一个研究项目,尚不清楚 Meta 是否会在其平台的一个服务中公开提供这项技术。鉴于它的强大性能和更高的生成效率,CM3leon 及其生成式人工智能方法有可能超越研究阶段最终得到应用。
用iPhone 5s拍照火了!取代CCD成小姐姐最爱
快科技9月2日消息,苹果已经宣布9月13日召开发布会,届时iPhone15系列将正式登场。最近一段时间,iPhone15系列也成了毫无疑问的机圈热门产品,但同时火起来的还有十年前的iPhone5s。最近在多个社交平台上,都出现很多女性用户喜欢用iPhone5s拍照,直呼YYDS”。这么一款在2013年9月10日发布的老古董走红,让很多人意想不到。站长网2023-09-02 15:45:590001爆火的生成式AI,能让智能音箱起死回生吗?
智能音箱这类如今几乎已经被大量消费者遗忘的产品,在此前经历了2017年、2018年的“疯狂”之后,早已不再是大多数消费者关注的对象。就在大家以为智能音箱会昙花一现时,ChatGPT的横空出世似乎让智能音箱有了焕发第二春的可能,也给了这个在走下坡路的行业一个新的机遇。那么,智能音箱与如今爆红的生成式AI能擦出火花吗?站长网2023-06-12 03:42:430000P图风波后李想首次发声:理想汽车将用光明反击黑暗
理想汽车旗舰车型理想MEGA今日启动交付,但自上市以来,该车在网络上遭遇诸多非议,甚至陷入离奇风波。理想汽车创始人李想,长久以来在微博上保持沉默,然而今日,他通过朋友圈发声,针对近期网络上的负面声音进行了正面回应。李想明确表示,近期网络上的风波,实际上是有组织的违法犯罪行为。他感谢众多用户和朋友的关心与支持,表示这些支持是他们成长的动力。对于存在的违法犯罪行为,理想汽车已经采取法律手段进行应对。站长网2024-03-11 10:55:300000第一次用AI写小说就获奖了,他们的创作秘籍大公开 | AI玩家对话
上个月,GenWorld联合HuggingFace、真格基金等举办了首届“中文AI微小说大赛”。参赛选手必须使用LLM(大语言模型)来创作小说,并提交具体的交互截图、聊天记录外链等材料,以证明作品是由LLM生成。而且为了保证公平性,比赛还严禁对AI生成的作品进行任何人工润色和加工。站长网2023-09-18 09:01:050000联发科与百度合作 推进文心大模型在联发科硬件平台上适配
联发科技(MediaTek)宣布与百度合作,共同推进飞桨和文心大模型在联发科技硬件平台上的适配。双方合作将实现大模型在终端设备和云端的协同工作,为用户提供突破性的生成式AI应用体验。这种终端侧部署生成式AI的方式在节约服务器成本、保护用户信息安全、提升实时性和实现个性化用户体验方面具有优势。合作的终端设备包括智能手机、汽车、智能家居和物联网等。站长网2023-08-16 18:12:500002