谷歌发布视频生成模型Lumiere 运动幅度和一致性表现良好
站长网2024-01-24 14:05:100阅
Lumiere 是谷歌发布的第三个视频生成模型,这次的模型演示视频质量非常高,运动幅度和一致性表现也很好。除了视频生成,该模型还支持各种视频编辑和生成控制能力。
Lumiere 是一款先进的模型,专门用于将文本转换为视频,这在视频合成领域是一大挑战。为了实现这一目标,谷歌采用了一种创新的空间-时间 U-Net 架构。

项目地址:https://top.aibase.com/tool/lumiere
这种架构能够一次性完成整个视频时长的生成,与传统视频模型不同。传统模型通常是先合成关键的远程帧,然后通过时间上的超级分辨率技术来处理,这种方法难以保持视频的全局时间连贯性。
Lumiere 通过在空间和关键的时间维度进行上下采样,并利用预先训练好的文本到图像扩散模型,使得该模型能够直接生成全帧率、低分辨率的视频,并且在多个空间-时间尺度上进行处理。
该模型在将文本转换成视频方面取得了领先成果,并证明了该设计能够轻松应用于各种内容创作和视频编辑任务,包括将图像转换为视频、视频修补和风格化视频创作。
0000
评论列表
共(0)条相关推荐
人工智能风口下,韩国Naver Cloud预计出口翻倍
**划重点:**1.🌐NaverCloud首席执行官表示,预计韩国NaverCloud的人工智能和云计算部门出口将在三年内至少翻一番,强调其AI服务可轻松定制以满足中国和美国以外地区买家需求。2.🇰🇷韩国是为数不多拥有基础人工智能模型的国家之一,Naver作为科技巨头在全球范围内与Alphabet的Google竞争,拥有主导地方搜索引擎的地位。0000李开复、张亚勤对谈:大模型产业化,To B、To C哪个赛道更有机会?
6月15日消息,在第六届“北京智源大会”上,零一万物CEO、创新工场董事长李开复博士,中国工程院院士、清华大学智能产业研究院(AIR)院长张亚勤院士、智源研究院理事长黄铁军教授,三位行业领袖就大模型的成功因素、面临的挑战、产业化场景等多个热点话题展开了深入的讨论。以下为讨论内容部分摘录:一、什么原因使得大模型如此成功?0000GPT-4绝对性能暴涨74.4%!UIUC苹果华人团队提出CodeAct,用Python代码统一LLM智能体行动
【新智元导读】最近,UIUC苹果华人提出了一个通用智能体框架CodeAct,通过Python代码统一LLM智能体的行动。一直以来,LLM智能体被众多业界AI大佬看好,甚至有望成为将人类从琐碎工作中解放出来的利器。但是,它们该如何与世界进行最佳互动?最近,来自UIUC和苹果的华人研究员,提出了一种全新的智能体框架——CodeAct。站长网2024-02-13 11:00:420000人工智能击败顶级电竞选手!DeepMind推AlphaStar Unplugged 通过离线学习掌握《星际争霸 II》玩法
文章概要:游戏成为AI评估的试金石:游戏一直是评估人工智能系统能力的重要场所,星际争霸II作为复杂的实时战略游戏,推动了AI在复杂性应用中的发展。离线RL方法的革命性引入:AlphaStarUnplugged通过离线RL方法,在固定数据集上进行学习,首次打败顶级职业星际争霸选手,突破了在线RL在复杂游戏中的难题。站长网2023-08-15 16:31:340000教育大厂“不务正业”,AI社交出海巴西、拿下近600万月活
今年春天,a16z发布了《Top100生成式AI消费(ToC)类应用》报告,里面一共提及了两款进入移动端MAU前50的AI社交产品,一款是Character.AI,另一款是Poly.AI,而后者已被证实来自国内在线教育厂商作业帮。图源:《Top100生成式AI消费(ToC)类应用》报告站长网2024-07-27 15:24:400001