Meta 推出基于 token 的全新 AI 图像生成模型 CM3leon:更高效先进
Meta 正在继续推进对新形式生成式人工智能模型的研究,并公布了最新成果,名为 CM3leon(发音类似于「chameleon(变色龙)」)。

图片来自Meta
CM3leon 是一个用于文本到图像创建和图像到文本创建的多模态基础模型,对于自动生成图像标题非常有用。
人工智能生成的图像在当前已经不是新概念,广泛可用的工具如 Stable Diffusion、DALL-E 和 Midjourney 已经取得了很大成功。
新鲜的是 Meta 正在使用构建 CM3leon 的技术以及 Meta 声称该基础模型能够实现的性能。
当前文本到图像生成技术主要依赖 diffusion 模型(Stable Diffusion 的名称源自此)来创建图像。CM3leon 则采用了不同的方法:基于 token 的自回归模型。
Meta 的研究人员在一篇名为《Scaling Autoregressive Multi-Modal Models: Pretraining and Instruction Tuning》的研究论文中写道:「近年来,由于性能强大且相对计算成本较低,diffusion 模型在图像生成工作中占据主导地位。相比之下,众所周知基于 token 的自回归模型也能产生出色的结果,尤其在全局图像连贯性方面更好,但训练和推理的成本要高得多。」
Meta 的研究人员已经能够通过 CM3leon 实际演示基于 token 的自回归模型实际上可以比基于 diffusion 模型的方法更高效。
Meta 的研究人员在一篇博客文章中写道:「尽管使用的计算资源比之前基于Transformer 的方法少了五倍,CM3leon 在文本到图像生成方面实现了最先进的性能。」
CM3leon 的基本工作原理在某种程度上与现有的文本生成模型类似。
Meta 的研究人员首先进行了一个检索增强的预训练阶段。与仅从互联网上收集公开可用的图像不同,这种方法已经给基于 diffusion 模型的模型带来了一些法律挑战,Meta 选择了一条不同的道路。
Meta 的研究论文指出:「在文本到图像生成领域,图像数据来源的道德影响已经引发了广泛的讨论。在本研究中,我们只使用 Shutterstock 上的经过授权的图像。因此,我们可以避免与图像所有权和归属相关的担忧,同时不会牺牲性能。」
在预训练之后,CM3leon 模型经过一阶段有监督微调(SFT),Meta 的研究人员声称这种方法产生了高度优化的结果,无论是资源利用还是图像质量。SFT 是 OpenAI 用于训练 ChatGPT 的一种方法。Meta 在研究论文中指出,SFT 用于训练模型理解复杂提示,在生成任务中非常有用。
论文中指出:「我们发现,指导调整显著提高了多模态模型在图像标题生成、视觉问答、基于文本的编辑和条件图像生成等各种任务中的性能。」
通过查看 Meta 在关于 CM3leon 的博客文章中分享的生成图像样本集,结果令人印象深刻,清楚地显示了模型理解复杂的多阶段提示,从而生成了分辨率极高的图像。
目前,CM3leon 仍然是一个研究项目,尚不清楚 Meta 是否会在其平台的一个服务中公开提供这项技术。鉴于它的强大性能和更高的生成效率,CM3leon 及其生成式人工智能方法有可能超越研究阶段最终得到应用。
贾跃亭打响上市资格保卫战 法拉第未来股价暴涨近370%
快科技5月15日消息,截止到5月14日美股收盘,法拉第未来(FF)股价暴涨367.54%,报收于0.285美元/股;盘中一度涨近490%,创下了FF自上市以来最高涨幅。FF方面表示,这标志着创始人贾跃亭正在进行的FF上市资格保卫战”已夺取开门红,特别是股价暴涨近370%的涨幅,给了资本市场以及公司内部巨大的信心。站长网2024-05-15 17:59:120000谷歌计划通过 Magi AI 聊天和短视频让搜索更加「个性化」
WSJ周六援引文件报道,谷歌正计划使其搜索引擎更加「直观、方便、个性化和人性化」,重点是为全球年轻人提供服务。这一举措是在人工智能(AI)应用程序如ChatGPT迅速流行的背景下推出的,这凸显了一种可能颠覆企业和社会运作方式的技术。据报道,谷歌在下周举行的年度I/O开发者大会上,预计将首次推出新功能,允许用户与一个AI程序对话。该项目代号为「Magi」。站长网2023-05-06 15:44:150000小米宣布小爱同学、小爱音箱升级AI大模型 已开启邀请测试
在昨日晚间的年度发布会上,小米宣布小爱同学已实现全新升级,正式接入大模型。升级后的小爱同学拥有一个更加强大的大脑,可以答疑解惑、激发灵感、创造艺术,还能扮演角色进行自然对话。小米表示,升级至MIUI14后,本次内测机型会分三批进行支持,第二批和第三批邀测时间将于后续公布,用户可在「小米社区APP-右下角“我的”-内测中心」中报名。具体情况如下:第一批(8月14号起陆续审核)站长网2023-08-15 08:53:390001OpenAI 打造媒体管理工具,让内容创作者可以选择退出 AI 训练
划重点:⭐OpenAI正在开发名为媒体管理(MediaManager)工具,让内容创作者可以指定其作品是否纳入AI研究和训练。⭐这一举措是为了回应对OpenAI数据采集方式的批评,同时保护知识产权和创作者利益。⭐除了OpenAI外,其他公司也在努力构建通用溯源和选择退出工具,以应对AI模型训练中的知识产权问题。站长网2024-05-08 21:42:480000小米科技春晚来了!小米15 澎湃全家桶蓄势待发
快科技9月14日消息,博主数码闲聊站预告,{tag_keyurl_2}将于10月正式亮相。同期发布的还有澎湃生态全家桶新品,包含11.16英寸平板电脑、小米eSIM智能手表、小米无线耳机等等,这将是今年年底小米最重磅的科技新品盛会。这些设备都搭载最新的澎湃OS,其中最受关注的机型是小米15,该机首发搭载澎湃OS2。0000