I2VEdit:修改单帧即可编辑整个视频 搞定虚拟试妆、风格转换
站长网2024-05-29 19:10:240阅
划重点:
⭐️ 利用预训练的图像到视频模型,编辑单帧就能扩散到整个视频
⭐️ 包括粗略运动提取和外观细化两个关键过程
⭐️保持外观和运动与原始视频的一致性,减少质量损失的跳跃间隔策略
近年来,扩散模型在图像和视频编辑方面的出色生成能力引发了广泛研究。与图像编辑相比,视频编辑在时间维度上面临额外挑战,而图像编辑已经见证了更多种类、高质量方法以及像 Photoshop 这样更强大的软件的发展。
针对这一差距,研究人员引入了一种新颖且通用的解决方案,通过使用预训练的图像到视频模型,将图像编辑工具的适用范围扩展到视频中,并将编辑从单帧传播到整个视频。他们的方法被称为 I2VEdit,能够根据编辑的程度自适应地保留源视频的视觉和运动完整性,有效处理全局编辑、局部编辑和适度形状变化,而现有方法无法完全实现。
产品入口:https://top.aibase.com/tool/i2vedit
该方法的核心包括两个主要过程:粗略运动提取,用于将基本运动模式与原始视频进行对齐;外观细化,用于使用细粒度的注意力匹配进行精确调整。
他们还结合了跳帧策略,以减轻跨多个视频剪辑的自回归生成带来的质量下降。实验结果表明,他们的框架在细粒度视频编辑方面表现出卓越性能,证明了其产生高质量、时间上连贯的输出的能力。
在应用上,I2VEdit可以实现视频编辑多种牛逼的视觉效果,比如:
虚拟试穿,使用 I2VEdit可以让虚拟试穿上升到新的高度,编辑源视频中的可穿戴对象。
主题替换,可以替换源视频的主题。
风格转换,使用 I2VEdit,可以更改源视频的风格。
0000
评论列表
共(0)条相关推荐
百度推出AIGC营销新创意平台“擎舵” AI数字人平台限时免费
百度宣布推出AIGC营销新创意平台—擎舵,通过多模态内容生成,突破创意生产力瓶颈,可轻松实现文案生成、图片生成和数字人视频制作三大创意生产能力。基于擎舵平台,百度营销正在打造营销场景下的专属创意生成工具,高质高效输出创意内容,推动客户服务经营路径的变化,AI数字人平台是重要代表。站长网2023-06-21 16:57:550000iOS17.2为 iPhone15Pro 的操作按钮添加翻译功能
苹果最近发布了iOS17.2更新,为iPhone15Pro系列的操作按钮添加了新的翻译功能。这个功能允许用户将翻译任务分配给操作按钮。当按下操作按钮时,它将启动翻译应用程序的对话模式,无需离开当前应用程序。这极大地简化了在不同语言之间快速翻译短语或进行对话的过程。站长网2023-10-27 09:46:570000欧盟征询新的技术规则是否适用于微软 Bing 和苹果 iMessage
站长之家(ChinaZ.com)10月10日消息:据路透社消息,欧盟反垄断监管机构正在征询微软的用户和竞争对手的意见,询问Bing是否应该遵守新的严格技术规则,以及是否应该适用于苹果的iMessage,知情人士周一表示。站长网2023-10-10 10:16:120000InstantMesh:只需10秒就能从图片转3D模型
InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型(LRM)的稀疏视图重建技术,极大地优化了3D资产的创建过程。项目地址:https://top.aibase.com/tool/instantmesh站长网2024-04-18 21:55:520001苹果发布Vision Pro耳机首个安全补丁 修复潜在黑客利用漏洞
苹果在科技巨头首次实际评测VisionPro耳机后的第二天发布了混合现实耳机的首个安全补丁。公司推出了visionOS1.0.2软件,该软件修复了VisionPro上运行的WebKit中的漏洞,该漏洞可能被黑客利用。漏洞修复后,苹果表示,如果受到利用,恶意代码将无法在受影响的设备上运行。站长网2024-02-01 11:06:220000