微软发布DragNUWA 1.5版本 可精细控制视频物体的运动路径
站长网2024-01-09 10:51:390阅
微软最近发布了DragNUWA1.5版本,这个新版本的功能让用户在通过图像生成视频之前,能够在图像上画出对应方向的箭头标记。这意味着,如果你标记的不是具体的物体,镜头就会按照你标记的方向运动。而如果你标记的是具体的物体,这个物体就会按照标记的方向运动。

项目地址:https://top.aibase.com/tool/dragnuwa
这一新功能的发布对于那些希望能够更方便地编辑视频的用户来说,无疑是一个非常实用的工具。这个功能的出现,将让用户可以更加方便地在编辑视频时进行定位和移动画面,无需复杂的后期编辑。这将大大提高视频编辑的效率和方便性。
从技术层面来看,DragNUWA1.5版本的功能可以通过人工智能技术来实现,通过识别用户在图像上的标记,自动调整视频画面的运动方向。这一技术的应用,不仅提高了视频编辑的效率,也为用户带来了更加直观和简便的编辑方式。
核心功能:
DragNUWA 的核心功能在于提供视频生成的精细控制。更新于2024年1月8日的1.5版本使用稳定的视频扩散作为骨干,根据特定路径对图像进行动画处理。该模型将文本、图像和轨迹作为关键控制因素,从语义、空间和时间的角度促使对视频生成进行精准控制。
入门指南:
要开始使用DragNUWA,用户只需克隆GitHub存储库并创建专用的Python环境。预训练权重可以手动下载到models/目录,也可以运行提供的脚本。设置完成后,用户可以使用python DragNUWA_demo.py命令启动Gradio演示,从而能够拖动图像并实时观察其动画效果。
0000
评论列表
共(0)条相关推荐
华为发布AI大模型存储新品OceanStor A310、FusionCube A3000
7月14日,华为发布两款AI大模型存储新品OceanStorA310、FusionCubeA3000。其中,OceanStorA310面向基础/行业大模型数据湖场景,实现从数据归集、预处理到模型训练、推理应用的AI全流程海量数据管理。站长网2023-07-14 16:31:090000Gartner 预测 2023 年全球 IT 支出将增长 4.3%:生成式 AI 尚未产生重大影响
根据市场调查机构Gartner发布的预测数据,到2023年,全球IT支出预计将达到4.7万亿美元,较2022年增长4.3%。报告指出,企业首席信息官(CIO)在争夺IT人才的竞争中失利,将更多的重心转向实现自动化和效率的技术上,用更少的员工推动更大规模的增长。站长网2023-07-20 17:41:450000Vast Data融资1.18亿美元,拓展人工智能工作负载的数据存储平台
**划重点:**1.💼纽约初创公司VastData完成1.18亿美元的E轮融资,估值91亿美元。2.🚀该公司提供面向人工智能和机器学习工作负载的无结构数据存储解决方案。3.🌏融资将用于扩大业务,重点覆盖亚太、中东和欧洲地区。0001SantaGPT登场!GPT-4助力,为你解锁完美圣诞
【新智元导读】圣诞将近,OpenAI推出SantaGPT,AI助力挑选礼物,彻底解决选择困难!2024的最后一个月,来自圣诞老人GPT的暖心陪伴不知不觉间,已经到了2024年的最后一个月。作为今年科技界版本之子的OpenAI,也是一刻都不能离开人们的视线。前段时间的董事会风波还没散尽,OpenAI就在12月的开头自己搞了波热度,——新推出了SantaGPT来迎接圣诞节的脚步。00018人半年肝出开源版GPT-4o,0延迟演示全网沸腾!背后技术揭秘,人人免费用
【新智元导读】GPT-4o或许还得等到今年秋季才对外开放。不过,由法国8人团队打造的原生多模态Moshi,已经实现了接近GPT-4o的水平,现场演示几乎0延迟,AI大佬纷纷转发。没想到,「开源版」GPT-4o这么快就来了!昨夜,来自法国AI实验室kyutai放出首个实时原生多模态Moshi,效果演示堪比5月发布的GPT-4o。站长网2024-07-04 17:18:450000