谷歌发布视频生成模型Lumiere 运动幅度和一致性表现良好
站长网2024-01-24 14:05:100阅
Lumiere 是谷歌发布的第三个视频生成模型,这次的模型演示视频质量非常高,运动幅度和一致性表现也很好。除了视频生成,该模型还支持各种视频编辑和生成控制能力。
Lumiere 是一款先进的模型,专门用于将文本转换为视频,这在视频合成领域是一大挑战。为了实现这一目标,谷歌采用了一种创新的空间-时间 U-Net 架构。

项目地址:https://top.aibase.com/tool/lumiere
这种架构能够一次性完成整个视频时长的生成,与传统视频模型不同。传统模型通常是先合成关键的远程帧,然后通过时间上的超级分辨率技术来处理,这种方法难以保持视频的全局时间连贯性。
Lumiere 通过在空间和关键的时间维度进行上下采样,并利用预先训练好的文本到图像扩散模型,使得该模型能够直接生成全帧率、低分辨率的视频,并且在多个空间-时间尺度上进行处理。
该模型在将文本转换成视频方面取得了领先成果,并证明了该设计能够轻松应用于各种内容创作和视频编辑任务,包括将图像转换为视频、视频修补和风格化视频创作。
0000
评论列表
共(0)条相关推荐
Meta开源最新模型——Llama Guard-7b
全球社交、科技巨头Meta在官网开源了全新模型——LlamaGuard。据悉,LlamaGuard是一个基于Llama2-7b的输入、输出保护模型,可对人机会话过程中的提问和回复进行分类,以判断其是否存在风险。可与Llama2等模型一起使用,极大提升其安全性。0002商务部:1-9月全国直播电商销售额达1.98万亿元,增长60.6%
划重点:1.🌐网络零售带动消费增长:1-9月全国网上零售额达10.8万亿元,增长11.6%,网络零售对社会消费贡献率达33.9%。2.💻直播电商蓬勃发展:全国直播电商销售额达1.98万亿元,增长60.6%,带动网络零售增速7.7%。3.🌾数实融合助力产业升级:推动农业全链条数字化转型,全国农村网络零售额增长12.2%,产业深度融合促进特色数字化产业带形成。站长网2023-10-20 16:17:270000智谱 AI 开源视觉语言模型 CogAgent 支持GUI图形界面问答
智谱AI开源了CogAgent,它是一个视觉语言模型,拥有180亿参数规模。该模型在GUI理解和导航方面表现出色,在多个基准测试上取得了SOTA的通用性能。它还支持高分辨率的视觉输入和对话问答,并且可以针对任意GUI截图进行问答。模型可以通过上传截图来进行任务推理,并返回计划、下一个动作以及具体操作的坐标信息。站长网2023-12-21 08:50:340001十年烧了3000亿,自动驾驶迎来梦醒时分
FastReading融资困难、人才逃离、岗位骤减,自动驾驶已不再是性感的赛道。L4迟迟无法落地,商业化前景更明确的L2成为重要造血手段。自动驾驶告别培育期,适者生存,活下来将成为未来几年的主题。被资本冷落3年后,关于自动驾驶的一切开始出现更深的裂痕。站长网2023-07-06 22:10:320002充电12分钟续航500公里!理想超充站加快建设 年底目标300座
快科技8月31日消息,理想汽车今日宣布,重庆健龙、南京栖霞山大桥、邯郸大名、邢台宁晋、邢台清河、保定唐县、唐山滦州服务区超充站正式投入使用。截止至今,理想汽车已经在全国运营50座5C超级充电站。理想汽车在此前表示,在国庆长假来临之前,将有超过100座超级充电站建设完成。北京到阿那亚、上海到千岛湖、深圳到汕头、昆明到大理、郑州到西安等热门的自驾游路线将得到全面覆盖。站长网2023-08-31 20:57:550000