谷歌发布视频生成模型Lumiere 运动幅度和一致性表现良好

站长网2024-01-24 14:05:100阅

Lumiere 是谷歌发布的第三个视频生成模型，这次的模型演示视频质量非常高，运动幅度和一致性表现也很好。除了视频生成，该模型还支持各种视频编辑和生成控制能力。

Lumiere 是一款先进的模型，专门用于将文本转换为视频，这在视频合成领域是一大挑战。为了实现这一目标，谷歌采用了一种创新的空间-时间 U-Net 架构。

项目地址:https://top.aibase.com/tool/lumiere

这种架构能够一次性完成整个视频时长的生成，与传统视频模型不同。传统模型通常是先合成关键的远程帧，然后通过时间上的超级分辨率技术来处理，这种方法难以保持视频的全局时间连贯性。

Lumiere 通过在空间和关键的时间维度进行上下采样，并利用预先训练好的文本到图像扩散模型，使得该模型能够直接生成全帧率、低分辨率的视频，并且在多个空间-时间尺度上进行处理。

该模型在将文本转换成视频方面取得了领先成果，并证明了该设计能够轻松应用于各种内容创作和视频编辑任务，包括将图像转换为视频、视频修补和风格化视频创作。

谷歌发布视频生成模型Lumiere运动幅度和一致性表现良好

0000

评论列表

共(0)条

相关推荐

人工智能风口下，韩国Naver Cloud预计出口翻倍
**划重点:**1.🌐NaverCloud首席执行官表示，预计韩国NaverCloud的人工智能和云计算部门出口将在三年内至少翻一番，强调其AI服务可轻松定制以满足中国和美国以外地区买家需求。2.🇰🇷韩国是为数不多拥有基础人工智能模型的国家之一，Naver作为科技巨头在全球范围内与Alphabet的Google竞争，拥有主导地方搜索引擎的地位。
站长网站长资讯2023-12-08 15:01:39
0000
李开复、张亚勤对谈：大模型产业化，To B、To C哪个赛道更有机会？
6月15日消息，在第六届“北京智源大会”上，零一万物CEO、创新工场董事长李开复博士，中国工程院院士、清华大学智能产业研究院（AIR）院长张亚勤院士、智源研究院理事长黄铁军教授，三位行业领袖就大模型的成功因素、面临的挑战、产业化场景等多个热点话题展开了深入的讨论。以下为讨论内容部分摘录：一、什么原因使得大模型如此成功？
站长网站长资讯2024-06-16 14:09:39
0000
站长资讯
GPT-4绝对性能暴涨74.4%！UIUC苹果华人团队提出CodeAct，用Python代码统一LLM智能体行动
【新智元导读】最近，UIUC苹果华人提出了一个通用智能体框架CodeAct，通过Python代码统一LLM智能体的行动。一直以来，LLM智能体被众多业界AI大佬看好，甚至有望成为将人类从琐碎工作中解放出来的利器。但是，它们该如何与世界进行最佳互动?最近，来自UIUC和苹果的华人研究员，提出了一种全新的智能体框架——CodeAct。
站长网2024-02-13 11:00:42
0000
站长资讯
人工智能击败顶级电竞选手！DeepMind推AlphaStar Unplugged 通过离线学习掌握《星际争霸 II》玩法
文章概要:游戏成为AI评估的试金石:游戏一直是评估人工智能系统能力的重要场所，星际争霸II作为复杂的实时战略游戏，推动了AI在复杂性应用中的发展。离线RL方法的革命性引入:AlphaStarUnplugged通过离线RL方法，在固定数据集上进行学习，首次打败顶级职业星际争霸选手，突破了在线RL在复杂游戏中的难题。
站长网2023-08-15 16:31:34
0000
站长资讯
教育大厂“不务正业”，AI社交出海巴西、拿下近600万月活
今年春天，a16z发布了《Top100生成式AI消费（ToC）类应用》报告，里面一共提及了两款进入移动端MAU前50的AI社交产品，一款是Character.AI，另一款是Poly.AI，而后者已被证实来自国内在线教育厂商作业帮。图源:《Top100生成式AI消费（ToC）类应用》报告
站长网2024-07-27 15:24:40
0001