I2VEdit:修改单帧即可编辑整个视频 搞定虚拟试妆、风格转换
站长网2024-05-29 19:10:240阅
划重点:
⭐️ 利用预训练的图像到视频模型,编辑单帧就能扩散到整个视频
⭐️ 包括粗略运动提取和外观细化两个关键过程
⭐️保持外观和运动与原始视频的一致性,减少质量损失的跳跃间隔策略
近年来,扩散模型在图像和视频编辑方面的出色生成能力引发了广泛研究。与图像编辑相比,视频编辑在时间维度上面临额外挑战,而图像编辑已经见证了更多种类、高质量方法以及像 Photoshop 这样更强大的软件的发展。
针对这一差距,研究人员引入了一种新颖且通用的解决方案,通过使用预训练的图像到视频模型,将图像编辑工具的适用范围扩展到视频中,并将编辑从单帧传播到整个视频。他们的方法被称为 I2VEdit,能够根据编辑的程度自适应地保留源视频的视觉和运动完整性,有效处理全局编辑、局部编辑和适度形状变化,而现有方法无法完全实现。

产品入口:https://top.aibase.com/tool/i2vedit
该方法的核心包括两个主要过程:粗略运动提取,用于将基本运动模式与原始视频进行对齐;外观细化,用于使用细粒度的注意力匹配进行精确调整。
他们还结合了跳帧策略,以减轻跨多个视频剪辑的自回归生成带来的质量下降。实验结果表明,他们的框架在细粒度视频编辑方面表现出卓越性能,证明了其产生高质量、时间上连贯的输出的能力。
在应用上,I2VEdit可以实现视频编辑多种牛逼的视觉效果,比如:
虚拟试穿,使用 I2VEdit可以让虚拟试穿上升到新的高度,编辑源视频中的可穿戴对象。
主题替换,可以替换源视频的主题。
风格转换,使用 I2VEdit,可以更改源视频的风格。
0000
评论列表
共(0)条相关推荐
4个月狂揽两千万,国内首个披露营收的大模型来了!
【新智元导读】稳居国内第一梯队的360智脑,已经开始赚钱了!根据360的2023年半年报,360智脑已创造近2000万元相关业务收入,成为国内首个披露实现营收的大模型产品。年初打得如火如荼的「百模大战」,终于有了阶段性的战果。站长网2023-09-01 17:12:030000试水不到一年,字节关停多个互动剧业务
Tech星球独家获悉,因业务调整,由字节商业化部门巨量引擎开发的多款探索IAP互动剧小程序业务将于6月17日关停,分别为泡泡心选、爪爪心选、果冻心选。这些互动剧业务以小程序的形式内嵌于抖音APP中。其中,果冻心选、爪爪心选由北京比特漫步互娱网络信息有限公司(下称:比特漫步)开发,泡泡心选则由北京巨量引擎网络技术有限公司开发。经企查查查询可知,两家公司都由抖音有限公司100%控股。站长网2024-06-13 11:21:410000Ilya宣判后GPT-5被曝屡训屡败,一次训数月,数据要人工从头构建
GPT-5被曝效果远不达预期。OpenAI连续12场发布会刚刚结束,大家最想看的GPT-5/4.5影子都没有,于是华尔街日报这边爆料了。GPT-5已至少完成2轮训练,每次长达数月,但是每次训练后都遇到新问题。OpenAI正在专门雇人写代码、做数学题为GPT-5从头创建数据,o1合成数据也用,但效率不够高,想要满足GPT-5的预训练需求有难度。0000AI涂鸦风靡小红书,草图秒变服装设计稿!网友:AI真的懂我
最近打开小红书,发现被各种涂鸦包围了……小红书@柔随手画的几笔涂鸦,交给AI,然后就变成了服装设计图。小红书@明玥几时有想要在裙子上加玫瑰花,只要画几个红色的圆圈,AI就懂了:小红书@拿辣条辣死你如果你是有点绘画功底的专业人士,精心设计了这样一件优雅的紫色旗袍,那么AI也能帮你生成模特上身图,背景都配好了。小红书@干饭选手又困了0000王小川称其用搜索的次数已经开始低于ChatGPT
据中国企业家杂志消息,近日,前搜狗CEO王小川在接受中国企业家采访时表示,目前其用搜索的次数已经开始低于ChatGPT的次数。站长网2023-04-26 09:39:330000