Meta 宣布推出用于视频生成和图像编辑的 Emu Video 和 Emu Edit 两款最新人工智能模型
社交媒体巨头 Meta 公司于 11 月 16 日在其博客文章中宣布推出最新的人工智能(AI)模型,用于内容编辑和生成。
这两款 AI 驱动的生成模型,分别为 Emu Video 和 Emu Edit,代表了行业的一大进步。Emu Video 利用 Meta 之前的 Emu 模型,能够基于文本和图像输入生成视频剪辑。而 Emu Edit 则专注于图像处理,承诺在图像编辑方面提供更高的精确度。
这些模型目前仍处于研究阶段,但 Meta 表示,初步结果显示出对创作者、艺术家和动画师等的潜在应用价值。
据 Meta 博客文章所述,Emu Video 采用了「分解式」训练方法,将训练过程分为两步,使模型能够对不同输入做出响应:「我们将过程分成两步:首先根据文本提示生成图像,然后根据文本和生成的图像生成视频。这种『分解式』或分步的视频生成方法让我们能够高效地训练视频生成模型。」该模型还可以基于文本提示「动画化」图像。Meta 称,Emu Video 不依赖于「深层级模型串联」,仅使用两个扩散模型就能以 16 帧每秒的速度生成 512x512 像素、四秒长的视频。
专注于图像处理的 Emu Edit,将使用户能夠进行去除或添加图像背景、执行色彩和几何变换,以及对图像进行局部和全局编辑。
Meta 在其声明中指出:「我们认为,主要目标不应仅仅是产生一个『可信』的图像。相反,模型应专注于精确地改变与编辑请求相关的像素。」该公司声称其模型能够精确地遵循指令:「例如,在棒球帽上添加『Aloha!』文字时,帽子本身应保持不变。」
Meta 使用计算机视觉任务训练了 Emu Edit,数据集包括 1000 万张合成图像,每张图像都有输入图像、任务描述以及目标输出图像。「我们相信这是迄今为止同类中最大的数据集,」公司表示。
Meta 最新发布的 Emu 模型是用 11 亿条数据训练的,包括 Facebook 和 Instagram 用户分享的照片和标题,Meta 首席执行官马克·扎克伯格在 9 月的 Meta Connect 活动中透露。
监管机构正在密切关注 Meta 基于 AI 的工具,导致这家科技公司采取了谨慎的部署方式。Meta 最近透露,它不允许政治活动和广告商使用其 AI 工具在 Facebook 和 Instagram 上创建广告。然而,该平台的一般广告规则并未特别涉及 AI。
苹果Vision Pro国行版今日正式开启预售 售价 29999 元起
站长之家(ChinaZ.com)6月14日消息:今日,苹果VisionPro国行版正式开启预售,这款被苹果CEO库克预言将在未来10年取代iPhone地位的革新产品,起始售价为29999元。用户可在三种内存版本中自由选择,包括256GB、512GB和1TB,每位消费者限购两台。站长网2024-06-14 23:51:040000马斯克关注 OpenAI 董事会的神秘决策,因为 Sam Altman 的回归未能回答关键问题
近日,OpenAI的核心科学家IlyaSutskever和公司CEOSamAltman的命运在董事会中引发了广泛关注。马斯克,作为OpenAI的前联合创始人之一,对Sutskever在公司内部所见到的、足以使他采取行动解雇Altman的事情表现出浓厚兴趣。站长网2023-11-27 09:46:590000罗永浩:海外同事抱怨 要是买不到理想就只能买宝马了
快科技9月3日消息,理想汽车日前公布了8月的交付信息,共计交付新车3.4914万辆,同比增长663.8%,其中,理想L系列的三款车型交付量均突破了万辆。有博主爆料了罗永浩对理想汽车8月份销量的评价,罗永浩朋友圈发文称:确实非常夸张,但你要是开过,又会觉得合情合理。站长网2023-09-03 17:09:200000AIGC音乐的中场战事:从技术、产品到商业规则
最近,谷歌围绕着AIGC音乐打出了一套“组合拳”。11月16日,谷歌旗下DeepMind发布了最新的AIGC音乐生成模型Lyria,并与YouTube合作打造了两个重要应用场景:DreamTrack和MusicAItools。同时,谷歌和YouTube还将AI识别工具SynthID扩展到音乐领域,为Lyria生成的AI作品打上水印。站长网2023-11-23 15:37:030000美国参议员致函敦促 AI 公司 CEO 采取措施应对风险 将安全放在工作最前沿
美国参议院情报委员会主席周三敦促几家人工智能(AI)公司的首席执行官优先考虑安全措施、消除偏见并负责任地推出新技术。站长网2023-04-27 15:48:210001