Meta AI开源T2V模型AVID 可修复视频改变纹理
站长网2023-12-12 10:48:431阅
Meta AI最近开源了AVID,这是一项具有先进修复和扩展能力的 T2V 模型。AVID 不仅支持通过文本编辑视频,还可以修复视频、更改视频对象、改变纹理和颜色,甚至删除视频内容或更换视频环境。
项目地址:https://zhang-zx.github.io/AVID/
这个开源项目是为了解决文本引导的视频修复所面临的三个主要挑战:时间一致性、不同保真度级别的支持以及处理可变的视频长度。
AVID 模型具备有效的运动模块和可调节的结构引导,可以用于固定长度的视频修复。此外,该模型还引入了一种新颖的时间多重扩散采样管道,具有中帧注意力引导机制,有助于生成任何所需持续时间的视频。经过综合实验,AVID 模型在不同的视频持续时间范围内都能稳健地处理各种修复类型,并且质量很高。
在培训阶段,AVID 模型采用了两步方法。首先,在主要文本到图像 (T2I) 修复模型的每一层后集成了运动模块,并对视频数据进行了优化。
其次,保留了 UNet $\epsilon_\theta$ 中的参数,并利用 UNet 编码器的参数副本专门训练了结构指导模块 $\mathbf{s}_\theta$。在推理过程中,对于长度为 $N^\prime$ 的视频,AVID 模型会构建一系列片段,每个片段包含 $N$ 个连续帧,并在每个去噪步骤中计算并汇总每个分段的结果。
0001
评论列表
共(0)条相关推荐
krea AI推出实时增强功能 支持将实时绘制的图像二次放大
今天,kreaAI宣布推出实时增强功能,支持将实时绘制的图像二次放大,放大后的图像会增加细节和分辨率。据了解,KreaAI是一款集成了文生图、AIpattern、LogoIllustration以及AI模型训练等功能的AI智能设计工具,近期因其强大的实时生成功能而备受瞩目。站长网2023-12-01 18:14:440001播放量超2亿,@米三汉 如何凭借超长内容俘获用户?
7.5个小时,堪比上一天班时长的视频,在短视频平台抖音走红了。近日,名著解读创作者@米三汉在抖音走红,“一口气读完《红楼梦》”视频播放量高达2.3亿,在抖音上掀起一股“文化热潮”。抖音快速走红创作者已不是新鲜事,值得注意的是,一个长视频内容,为何能在短视频平台上,吸引了如此多的关注。站长网2024-07-09 11:51:470000Stability AI发布移动端语言模型Stable LM 3B
StabilityAI发布了最新的语言模型StableLM3B,该模型是为便携式数字设备设计的,参数规模为30亿,比行业通常使用的70亿参数模型要小,具有更高的性能和可移植性。StableLM3B具有较小的体积和高效性的优势,需要更少的资源和较低的运行成本,使其对大多数用户来说更加可承受。与此同时,它的能效更高,减少了能源消耗,具有环保特性。站长网2023-10-09 09:25:240001游戏版号单次审批数量首次突破百款 2023年发放游戏版号1075款
今天,国家新闻出版署公布了新一批国产游戏版号,单次审批数量首次突破百款,其中不乏腾讯、网易等大厂的作品,同时也涵盖了小型工作室的作品,种类丰富多样。中国音像与数字出版协会游戏工委迅速通过公众号发文,认为这次版号的快速发放,展现了主管部门对网络游戏发展的坚定支持态度。站长网2023-12-25 17:32:230000京东:618期间将推出总裁AI数字人直播 带来真5折低价
5月31日晚8点,京东将正式开启“京东618,又便宜又好”活动。活动以用户体验为核心,旨在提供优质、低价的购物体验。京东CEO许冉强调,用户体验是京东的核心价值观,从过去的百亿补贴、春晓计划到现在的优质服务和技术创新,京东一直致力于不断提升用户体验。站长网2024-05-29 17:58:000000