谷歌版Sora升级4K高清！一句话控制镜头运动，跑分叫板可灵海螺

站长网2024-12-17 09:05:540阅

OpenAI直播划水的一天，谷歌版Sora迎来了它的2.0——

Veo2，根据文本或图像生成更为高质量的视频。

从官方介绍中看，此次主要有三个方面的升级。

比如分辨率能达到4K。

能够理解有关镜头控制的Prompt。

更注重现实物理世界与人类表情的理解和展示。

在官方账号底下，大家都对这些效果表示了惊叹:

我真的想谷歌输掉比赛，但是谷歌没有输。

另外，图像生成模型Imagen3也有进一步的改进。

谷歌版Sora2.0:重新定义质量和控制

质量和控制，是此次视频模型升级的关键词。

除了显而易见的清晰度的提升——最高可达4K分辨率，它能够忠实地遵循简单和复杂的指令Prompt，并令人信服地模拟现实世界的物理以及各种视觉风格。

具体体现在它的真实感和保真度上，比如细节、伪影减少等方面都有显著改进。

还有高级的运动功能，基于对物理学的理解，能够更高精度的表示运动。

还能准确地遵循各种镜头控制类的Prompt，比如拍摄风格、角度、动作以及所有这些的组合。

那么接下来直观地感受一下效果。

，时长00:08

Prompt:特写镜头聚焦于一位女 DJ 的脸部，她美丽、浓密的黑色卷发勾勒出她的五官，她完全沉浸在音乐中。她闭上双眼，沉浸在节奏中，嘴角挂着一丝微笑。当她随着节拍点头和摇摆时，相机捕捉到了她头部的细微动作，她的身体本能地随着耳机中传出的音乐而做出反应，传到人群中。浅景深使背景变得模糊。她被鲜艳的霓虹色包围着。特写镜头强调了她迷人的气质以及音乐传递和超越的力量。

还有是这种集体的蜂群也能刻画出来。

，时长00:08

Prompt:镜头轻轻飘过一排排粉刷过的木制蜂箱，嗡嗡作响的蜜蜂在画面中进进出出。镜头落在站在画面中央的优雅农民身上，他洁白的养蜂服在金色的午后阳光下闪闪发光。他举起一罐蜂蜜，稍微倾斜以捕捉光线。在他身后，高大的向日葵在微风中有节奏地摇曳，花瓣在温暖的阳光下闪闪发光。镜头向上倾斜，露出一座复古的农舍，百叶窗是薄荷绿色的，摇曳的树木在墙上投下斑驳的阴影。用35毫米镜头在柯达 Portra400胶片上拍摄，金色的光线在农民的手套、果酱罐和蜂箱的风化木材上形成了丰富的纹理。

还可以切换镜头，从近景到远景，而在镜头之下，不管是蜂蜜还是咖啡的泡沫细节都有精确地刻画。

，时长00:08

Prompt:太阳在一盘摆放整齐的早餐场景后缓缓升起。浓稠的金色枫糖浆以慢动作倒在松软的煎饼上，每一块煎饼都散发出柔软温暖的蒸汽云。特写镜头中，脆培根发出嘶嘶声，金色油脂的细小余烬在空中飞舞。咖啡以顺滑的旋转动作倒入水晶般透明的杯子中，杯子里充满了深棕色的咖啡油层。场景结束时，相机俯冲到新鲜切好的橙子上，以令人惊叹的微距细节展示出它明亮多汁的果肉。

那么在根据人类对其性能的评估中，Veo2的表现优于其他领先的视频生成模型

在Meta基准数据集 MovieGenBench上，人类参与者观看了1003个提示和响应的视频。

结果显示，跟市面上的主流视频生成模型相比，Veo2.0在整体偏好、Prompt指令准确遵循方面都表现最佳。

值得一提的是，这里除了Sora，国产模型可灵、MiniMax都上桌了。

所有的比较都在720P分辨率下进行，Veo 采样时长为8秒，VideoGen 采样时长为10秒，其他型号采样时长为5秒。我们向评分者展示完整视频时长。

最后，他们表示，创建逼真、动态或复杂的视频，并在复杂场景或复杂运动的场景中保持完全一致性仍然是一项挑战。他们将继续开发和改进这些领域的性能。

图像模型Imagen3也增强了

除此之外，还增强了他们的图像生成模型Imagen3。

可以生成更多样化的艺术风格，如现实主义、梦幻、肖像画等等。

生成的图像会更忠实于Prompt，哪怕这个Prompt有多么地离谱。（Doge）

而从各种生成的图像来看，视觉效果也比之前更明亮，构图也更加平衡。

好了，感兴趣的朋友可戳下方链接了解更多详情。

参考链接:

[1]https://deepmind.google/technologies/veo/veo-2/

[2]https://x.com/GoogleDeepMind/status/1868703624714395907

[3]https://deepmind.google/technologies/imagen-3/

—完—

谷歌版Sora升级4K高清一句话控制镜头运动跑分叫板可灵海螺

0000

评论列表

共(0)条

相关推荐

站长资讯
鸿蒙原生应用美团淘宝等接入华为账号：支持一键登录
快科技9月4日消息，据报道，包括美团、淘宝、京东、小红书等头部应用在内的60多款鸿蒙原生应用均已支持华为账号一键登录，覆盖便捷生活、社交通讯、购物比价、新闻阅读等领域，为用户带来更高效、更安全的登录体验。以美团为例，使用华为账号登录美团时，无需输入账号密码或接收验证码，美团将直接采用华为账号提供的手机号作为美团账号唯一ID，从而实现快速登录。
站长网2024-09-05 16:50:39
0000
站长资讯
开源聊天机器人Web UI框架Chatbot UI 可轻松创建任意模型聊天机器人
ChatbotUI是一个开源的聊天机器人WebUI框架，它支持接入多种模型，包括OpenAI、AzureOpenAI、Anthropic、Google、Mistral和Perplexity等。此外，它还支持Ollama上的本地模型接入。这意味着只需输入这些模型的API，就能轻松创建非常美观的任意模型聊天机器人。
站长网2024-01-12 11:36:31
0001
站长资讯
理想汽车第400座超充站上线！年底即将达成超2000座
快科技5月16日消息，理想汽车近日宣布，其第400座超级充电站已正式投入运营，这一成就仅用了392天时间实现。公司进一步透露，计划到今年年底建设超过2000座超级充电站，安装超过1万根充电桩。2024年，理想汽车计划在国家级高速干线里程的覆盖率超过70%，1-3线城市核心城区覆盖率超过90%。理想汽车还表示，目前已经成功构建了超过20条热门的充电旅游路线。
站长网2024-05-16 12:04:44
0001
站长资讯
马斯克的脑机接口公司Neuralink再融资4.3亿美元
##划重点🚀**新一轮融资:**Neuralink，由ElonMusk创办的大脑植入芯片公司，最近完成了一轮4300万美元的新融资，引起市场关注。
站长网2023-11-26 14:17:00
0000
站长资讯
专家预测:人工智能将是人类灭绝的首要原因，其次是核战争和病毒
本文概要:1.专家预测人工智能将是人类灭绝的首要原因。2.核战争和病毒将是人类继人工智能后可能导致灭绝的原因。据印度媒体indianexpress报道，在“生活、科学与一切事物”系列讲座中，科学家兼前印度科学与工业研究理事会总干事谢卡尔·曼德博士谈到了人类灭绝的问题，以及其他相关议题。
站长网2023-08-15 11:26:23
0002