DragNUWA :一个可以实现精细控制的视频生成模型

站长网2023-08-19 15:33:101阅

DragNUWA 是一种基于扩散算法的视频生成模型，DragNUWA 模型旨在解决视频生成中的精细控制问题。该模型通过引入文本、图像和轨迹信息，并从语义、空间和时间角度提供精细控制。

论文地址:https://arxiv.org/pdf/2308.08089.pdf

模型中的轨迹建模包括轨迹采样器（TS）、多尺度融合(MF)和自适应训练(AT)策略。实验证明 DragNUWA 模型在视频生成的精细控制方面表现出色。

核心功能:

DragNUWA 在语义、空间和时间维度上同时引入文本、图像和轨迹信息，提供了精细控制视频生成的能力。

它采用轨迹采样器、多尺度融合和自适应训练策略，实现了开放域轨迹控制和生成连贯的视频。该模型在实验中展现出优越的细粒度控制性能。

DragNUWA一个可以实现精细控制的视频生成模型

0001

评论列表

共(0)条

相关推荐

站长资讯
日本航天局与铁路公司合作，利用人工智能预测轨道上的故障
划重点:-🛰️日本航天局（JAXA）与西日本旅客铁路公司(JR-West)合作，将后者的人工智能(AI)故障预测技术应用于卫星操作。-🚂这项合作旨在利用数据来预测工作卫星的故障，并解决它们，就像铁路设备维护一样。-🌐卫星运营商SKYPerfectJSATCorporation也参与其中，旨在通过改进AI模型的开发来检测轨道上的异常情况。
站长网2024-05-24 17:57:28
0001
AI视频生成的2024，Sora务虚、即梦和可灵务实
自从ChatGPT成为有史以来最快突破亿级用户规模的消费级应用，AI行业的大变局就到来了。随后大家开始谈起了AI会给人类社会带来的深刻变革与挑战，比尔·盖茨甚至认为AIGC（生成式人工智能）的重要性不亚于互联网的发明，将改变我们的世界。
站长网站长资讯2025-02-02 16:25:05
0000
站长资讯
一加Ace 3V真机公布网友：美爆了
快科技3月13日消息，一加科技李杰公布了一加Ace3V真机照。在评论区，不少网友称赞颜值很高”、美爆了”。据悉，一加Ace3V采用中置挖孔直屏，中框为直角边设计，去掉了屏幕塑料支架，正面视觉接近四边等窄，颜值出众。背部摄像头模组为纵向排布，闪光灯为环形设计，保持一定辨识度的同时也提升了颜值。
站长网2024-03-13 10:40:20
0000
站长资讯
代码都让AI写，CS还有前途吗？加州大学伯克利分校：CDSS申请人数飙升48%
AI写了这么多代码，你还应该学习计算机科学吗?新的数据表明，学生们仍然成群结队地在大学里选修计算机:加州大学伯克利分校（UCB）计算机科学专业的一年级申请人数猛增48%!UCB教授分析，AI还没有学会创新，人类软件开发者可以利用AI提质增效。围绕生成式人工智能最广泛的担忧之一，就是这项技术是否会让打工人失业。
站长网2024-06-17 11:41:48
0000
站长资讯
8城具体地点公布！特斯拉Cybertruck中国巡展1月28日开启
站长之家（ChinaZ.com）1月26日消息:特斯拉Cybertruck将于1月28日在中国开始巡展，这是该车型在中国的首次公开亮相。此次活动名为“特斯拉赛博越野旅行车中国巡展”，旨在让更多中国消费者近距离了解这款创新的电动皮卡。
站长网2024-01-26 17:01:19
0002