Meta 推出免费独立的 AI 图像生成器网站「Imagine with Meta AI」
在谷歌推出 Gemini 之后,Meta 也不甘示弱,在网络上推出了基于其Emu 图像合成模型的免费独立 AI 图像生成器网站——Imagine with Meta,允许用户通过自然语言描述来生成图像。
Imagine with Meta AI 网站截图
Meta 使用了 11 亿张 Facebook 和 Instagram 上公开可见的图片来训练这个 AI 模型,该模型可以根据文本提示渲染新图像。此前,Meta 的这项技术——使用相同的数据——仅在诸如 Instagram 的消息传递和社交网络应用程序中可用。
如果你使用 Facebook 或 Instagram,很可能你的照片(或你拍摄的照片)帮助训练了 Emu。从某种意义上说,老话「如果你不付费,你就是产品」已经有了全新的含义。虽然截至 2016 年,Instagram 用户每天上传超过 9500 万张照片,但 Meta 用来训练其 AI 模型的数据集只是其整体照片库的一小部分。
Meta 表示,它只使用公开可用的照片进行训练,因此将 Instagram 或 Facebook 上的照片设为私有应该可以防止它们被公司未来的 AI 模型训练所包含(当然,除非它改变这一政策)。
Imagine with Meta AI
「Imagine with Meta AI」类似于 Stable Diffusion、DALL-E 3 和 Midjourney,根据 AI 模型从训练数据中学到的视觉概念生成新图像。使用这个新网站创建图像需要一个 Meta 帐户,可以从现有的 Facebook 或 Instagram 帐户导入。每次生成会创建四张 1280×1280 像素的图片,可以以 JPEG 格式保存。图片在左下角包含一个小小的「Imagined with AI」水印标志。
Meta 在其新闻稿中说:「我们很高兴听到人们分享他们是如何使用 imagine 来制作有趣和富有创意的内容的,imagine 是 Meta AI 的文字转图片生成功能。今天,我们将 imagine 的访问权限扩展到聊天之外,首先在美国推出 imagine.meta.com。这个独立体验面向创意爱好者,让你使用来自 Emu 的技术创造图像。」
Meta 的模型通常可以很好地创建逼真的图像,但不如 Midjourney。它可以处理比 Stable Diffusion XL 更复杂的提示,但也许不如 DALL-E 3。它在文本渲染方面做得并不好,不同媒体输出,如水彩、刺绣和钢笔墨水的处理结果参差不齐。其人物图像似乎包括了不同种族背景的多样性。总的来说,就目前 AI 图像合成而言,它似乎表现一般。
Facebook 和 Instagram 让这一切成为可能
那么,我们对 Emu——Meta 新 AI 图像生成功能背后的 AI 模型——了解多少呢?根据 Meta 在 9 月发布的一篇研究论文,Emu 通过一个称为「质量调整」的过程获得了生成高质量图像的能力。与使用大量图像文本对训练的传统文本到图像模型不同,Emu 在预训练后专注于「美学对齐」,使用一组相对较小但视觉上吸引人的图像。
然而,Emu 的核心仍然是前面提到的从 Facebook 和 Instagram 抽取的 11 亿个文本图像对的庞大预训练数据集。在 Emu 的研究论文中,Meta 没有具体说明训练数据来自何处,但 Meta Connect 2023 会议的报道援引 Meta 全球事务总裁尼克·克莱格(Nick Clegg)的话说,他们正在使用社交媒体帖子作为 AI 模型的训练数据,包括输入 Emu 的图像。
这是 Meta 与其他 AI 公司的方法不同的地方,因为 Meta 可以访问其服务中的大量图像和标题数据。其他图像合成模型使用从互联网非法抓取的图像、从商业图库获得的许可图像,或两者的组合。
有趣的是,Meta 关于 Emu 的研究论文是我们所见的第一篇关于主要图像合成模型的论文,它没有声明该模型可能创造扭曲现实的虚假信息或潜在有害内容的可能性。这反映了 AI 图像合成模型的普遍接受(或放弃),这些模型现在变得更加普遍。这是否是一件好事是一个悬而未决的问题。
尽管如此,Meta 似乎正在通过过滤器、尚未运作的拟议水印系统(该公司表示:「在未来几周内,我们将为 imagine with Meta AI 体验添加不可见的水印,以提高透明度和可追踪性」)以及网站底部的小声明来处理潜在有害输出的问题:「图片可能是不准确或不恰当的。」
这些图像可能不准确,甚至可能在未命名的 11 亿张用于训练模型的图像作者看来是不道德的。但我们敢说:生成这些图像可能很有趣。当然,根据你的态度以及你对 AI 图像合成速度的看法,这种乐趣可能会被同等程度的关注所抵消。
上海智能实验室推图文多模态大模型InternLM-XComposer2(浦语·灵笔2)
InternLM-XComposer2是一款先进的视觉-语言模型,在自由组合文本和图像以及理解这两者之间的内容方面表现卓越。这款模型不仅超越了传统的视觉-语言理解,而且能够巧妙地将多样化的输入,如概要、详尽的文本描述和参考图片,融合成包含文本和图像的复合内容,实现高度定制化的创作。项目地址:https://top.aibase.com/tool/internlm-xcomposer2站长网2024-01-31 17:20:200000美团、朴朴偷袭叮咚,预制菜能撑几时?
近日,叮咚买菜旗下预制菜品牌“朝气鲜食”正式发布,今年的销售目标是1亿元,目前正在招募区域经销商、渠道商等合作伙伴。对于低迷已久的生鲜电商行业来说,叮咚此次掷下豪言的原因,或是因为其终于实现了公司成立五年多来的首次盈利。据叮咚2022年第四季度财报显示,其首次实现GAAP标准下的全面盈利,Non-GAAP净利润为1.16亿元,公司还实现了全年正向经营性现金流。站长网2023-04-24 12:14:160000蔚来辟谣:奔驰将与蔚来共享换电站消息系伪造
快科技6月14日消息,近日有网传图片显示,奔驰下一代纯电车型,将和蔚来共享换电站”。针对这一消息,蔚来法务部官微回复称:这张图是伪造的,请勿传谣。”之所以会出现着这样的谣言,是因为不久前一张蔚来创始人、CEO、董事长李斌与梅赛德斯-奔驰集团股份公司董事会主席康林松(OlaK?llenius)会面的照片在社交网络流传。0001阿里云通义千问大模型正式向全社会开放
今天,阿里云宣布通义千问大模型已首批通过备案,并正式向公众开放,广大用户可登录通义千问官网(https://qianwen.aliyun.com/)体验,企业用户可以通过阿里云调用通义千问API(https://dashscope.console.aliyun.com/model)。站长网2023-09-13 09:29:420000更换CEO,马云刘强东嗅到了危险信号
6月20日,阿里巴巴集团宣布,张勇将于今年9月10日卸任董事会主席兼CEO职务,专职担任阿里云智能集团董事长兼CEO;同时,阿里执行副主席蔡崇信将出任董事会主席,淘天集团董事长吴泳铭出任阿里CEO。消息并不让人感到意外。此前,有媒体已放出马云重新介入经营的消息。站长网2023-06-22 01:57:200000