DragNUWA :一个可以实现精细控制的视频生成模型
站长网2023-08-19 15:33:101阅
DragNUWA 是一种基于扩散算法的视频生成模型,DragNUWA 模型旨在解决视频生成中的精细控制问题。该模型通过引入文本、图像和轨迹信息,并从语义、空间和时间角度提供精细控制。
论文地址:https://arxiv.org/pdf/2308.08089.pdf
模型中的轨迹建模包括轨迹采样器(TS)、多尺度融合(MF)和自适应训练(AT)策略。实验证明 DragNUWA 模型在视频生成的精细控制方面表现出色。
核心功能:
DragNUWA 在语义、空间和时间维度上同时引入文本、图像和轨迹信息,提供了精细控制视频生成的能力。
它采用轨迹采样器、多尺度融合和自适应训练策略,实现了开放域轨迹控制和生成连贯的视频。该模型在实验中展现出优越的细粒度控制性能。
0001
评论列表
共(0)条相关推荐
特斯拉CEO马斯克:比亚迪的产品极具竞争力
日前,有推特网友转发了一段特斯拉CEO马斯克评价比亚迪汽车的视频。视频中,主持人问道:你如何评价比亚迪,马斯克没有直接回答,反而是直接大笑。随后又反问道,你见过比亚迪的车辆吗?我不认为比亚迪有什么好的产品”。对此,马斯克转发视频并评论道,那是很多年前的事了,如今,比亚迪的汽车极具竞争力。站长网2023-05-27 15:34:430000思科280亿美元收购Splunk,加强企业在AI时代安全保障
文章概要:1.思科计划以280亿美元收购Splunk,将成为全球最大的软件供应商之一,致力于帮助企业在人工智能普及的时代更好地保障自身安全。2.这一收购将加强思科的安全能力,推动企业从威胁检测和响应转向威胁预测和预防,以适应不断演变的数字化业务和人工智能加速采用的IT景观。3.思科和Splunk将合作帮助企业客户充分利用人工智能机会,提高对其数据的可视化和洞察力。站长网2023-09-22 11:19:320000HyperCore加持!小米15首发骁龙8至尊版:强得不可思议
小米公司即将于10月29日发布新机型小米15,这款手机将首次搭载高通骁龙8至尊版处理器。骁龙8至尊版处理器采用了台积电第二代3nm制程技术,并采用了双超大核方案,雷军强调,结合小米自研的HyperCore架构和内置的微架构调度器,该处理器的能效表现将非常出色。0000估值5亿美元了,抓住日韩,AI语言学习产品跻身赛道Top3(上)
上周,AI语言学习产品Speak又融资了,完成了2000万美金B-3轮融资,由BuckleyVentures领投,之前领投了2700万美金轮次的OpenAIStartupFund这次也跟投了。完成本轮融资之后,Speak的总融资额达到8400万美金,光2023年就融了两轮,现在估值达到5亿美金,相比去年估值翻倍。站长网2024-07-11 20:29:230000百度数字人生成专利公布:可赋予数字人不同人格
百度在线网络技术(北京)有限公司最近公布了一项关于“数字人生成方法和装置”的专利申请。这项专利涉及人工智能技术领域,具体包括计算机视觉、自然语言处理、深度学习等技术领域,可应用于元宇宙、数字人等场景。该专利方法的一具体实施方式包括:首先获取人格对话语料集和预先训练的语言模型;然后利用人格对话语料集对语言模型进行训练,得到人格对话模型。0000