微软发布DragNUWA 1.5版本可精细控制视频物体的运动路径

站长网2024-01-09 10:51:390阅

微软最近发布了DragNUWA1.5版本，这个新版本的功能让用户在通过图像生成视频之前，能够在图像上画出对应方向的箭头标记。这意味着，如果你标记的不是具体的物体，镜头就会按照你标记的方向运动。而如果你标记的是具体的物体，这个物体就会按照标记的方向运动。

项目地址:https://top.aibase.com/tool/dragnuwa

这一新功能的发布对于那些希望能够更方便地编辑视频的用户来说，无疑是一个非常实用的工具。这个功能的出现，将让用户可以更加方便地在编辑视频时进行定位和移动画面，无需复杂的后期编辑。这将大大提高视频编辑的效率和方便性。

从技术层面来看，DragNUWA1.5版本的功能可以通过人工智能技术来实现，通过识别用户在图像上的标记，自动调整视频画面的运动方向。这一技术的应用，不仅提高了视频编辑的效率，也为用户带来了更加直观和简便的编辑方式。

核心功能:

DragNUWA 的核心功能在于提供视频生成的精细控制。更新于2024年1月8日的1.5版本使用稳定的视频扩散作为骨干，根据特定路径对图像进行动画处理。该模型将文本、图像和轨迹作为关键控制因素，从语义、空间和时间的角度促使对视频生成进行精准控制。

入门指南:

要开始使用DragNUWA，用户只需克隆GitHub存储库并创建专用的Python环境。预训练权重可以手动下载到models/目录，也可以运行提供的脚本。设置完成后，用户可以使用python DragNUWA_demo.py命令启动Gradio演示，从而能够拖动图像并实时观察其动画效果。

微软发布DragNUWA1 5版本可精细控制视频物体的运动路径

0000

评论列表

共(0)条

相关推荐

幻方量化回应管理规模缩水：正常的规模变动
据近日消息，针对传闻中幻方量化管理规模大幅缩水的说法，该公司市场部人员做出回应，称公司管理规模已超过200亿元。对于规模变动原因，其表示为正常波动。幻方量化作为国内知名量化机构，成立于2015年，发展迅速，旗下拥有九章资产和宁波幻方量化两家百亿级平台。
站长网站长资讯2025-02-25 08:12:46
0000
站长资讯
AI音乐创作助手Soundful 提供各种风格的音乐模板
Soundful是一个一站式音乐创作助手，让你只需轻点按钮就能创作出专业水准的原创音乐。Soundful提供各种风格的音乐模板，涵盖流行、电子、嘻哈等多种流派。你可以根据风格、心情或喜好的艺人，快速找到适合你创作风格的模板。随机预览模板，一目了然Soundful为你提供的无限可能。体验地址:https://my.soundful.com/
站长网2023-09-18 09:55:33
0000
站长资讯
GitHub热榜登顶：开源版GPT-4代码解释器，可安装任意Python库，本地终端运行
ChatGPT的代码解释器，用自己的电脑也能运行了。刚刚有位大神在GitHub上发布了本地版的代码解释器，很快就凭借3k星标并登顶GitHub热榜。不仅GPT-4本来有的功能它都有，关键是还可以联网。ChatGPT“断网”的消息传出后引起了一片哗然，而且一关就是几个月。这几个月间联网功能一直杳无音讯，现在可算是有解决的办法了。
站长网2023-09-06 17:47:47
0000
IP流量化的时代，迪士尼如何继续做百年老店
有超过3600名合作伙伴出席了9月10日在上海世博馆举办的华特迪士尼有限公司大中华区2025消费品部启动大会。庞大的与会人数是行业对这家国际IP巨头期待值和迫切需求感的一种具象。这来自于迪士尼授权业务在过去一年的精彩表现，过去一年，以620亿美金的零售表现，迪士尼继续领跑全球授权业;中国公司及其合作伙伴则先后获得2项亚洲授权业卓越大奖及3项中国授权业大奖。
站长网站长资讯2024-09-27 00:40:41
0000
站长资讯
腾讯绝艺AI登顶日本麻将平台 AI决策能力提升
站长网2023-07-12 16:23:47
0000