微软发布DragNUWA 1.5版本 可精细控制视频物体的运动路径
站长网2024-01-09 10:51:390阅
微软最近发布了DragNUWA1.5版本,这个新版本的功能让用户在通过图像生成视频之前,能够在图像上画出对应方向的箭头标记。这意味着,如果你标记的不是具体的物体,镜头就会按照你标记的方向运动。而如果你标记的是具体的物体,这个物体就会按照标记的方向运动。

项目地址:https://top.aibase.com/tool/dragnuwa
这一新功能的发布对于那些希望能够更方便地编辑视频的用户来说,无疑是一个非常实用的工具。这个功能的出现,将让用户可以更加方便地在编辑视频时进行定位和移动画面,无需复杂的后期编辑。这将大大提高视频编辑的效率和方便性。
从技术层面来看,DragNUWA1.5版本的功能可以通过人工智能技术来实现,通过识别用户在图像上的标记,自动调整视频画面的运动方向。这一技术的应用,不仅提高了视频编辑的效率,也为用户带来了更加直观和简便的编辑方式。
核心功能:
DragNUWA 的核心功能在于提供视频生成的精细控制。更新于2024年1月8日的1.5版本使用稳定的视频扩散作为骨干,根据特定路径对图像进行动画处理。该模型将文本、图像和轨迹作为关键控制因素,从语义、空间和时间的角度促使对视频生成进行精准控制。
入门指南:
要开始使用DragNUWA,用户只需克隆GitHub存储库并创建专用的Python环境。预训练权重可以手动下载到models/目录,也可以运行提供的脚本。设置完成后,用户可以使用python DragNUWA_demo.py命令启动Gradio演示,从而能够拖动图像并实时观察其动画效果。
0000
评论列表
共(0)条相关推荐
幻方量化回应管理规模缩水:正常的规模变动
据近日消息,针对传闻中幻方量化管理规模大幅缩水的说法,该公司市场部人员做出回应,称公司管理规模已超过200亿元。对于规模变动原因,其表示为正常波动。幻方量化作为国内知名量化机构,成立于2015年,发展迅速,旗下拥有九章资产和宁波幻方量化两家百亿级平台。0000AI音乐创作助手Soundful 提供各种风格的音乐模板
Soundful是一个一站式音乐创作助手,让你只需轻点按钮就能创作出专业水准的原创音乐。Soundful提供各种风格的音乐模板,涵盖流行、电子、嘻哈等多种流派。你可以根据风格、心情或喜好的艺人,快速找到适合你创作风格的模板。随机预览模板,一目了然Soundful为你提供的无限可能。体验地址:https://my.soundful.com/站长网2023-09-18 09:55:330000GitHub热榜登顶:开源版GPT-4代码解释器,可安装任意Python库,本地终端运行
ChatGPT的代码解释器,用自己的电脑也能运行了。刚刚有位大神在GitHub上发布了本地版的代码解释器,很快就凭借3k星标并登顶GitHub热榜。不仅GPT-4本来有的功能它都有,关键是还可以联网。ChatGPT“断网”的消息传出后引起了一片哗然,而且一关就是几个月。这几个月间联网功能一直杳无音讯,现在可算是有解决的办法了。站长网2023-09-06 17:47:470000IP流量化的时代,迪士尼如何继续做百年老店
有超过3600名合作伙伴出席了9月10日在上海世博馆举办的华特迪士尼有限公司大中华区2025消费品部启动大会。庞大的与会人数是行业对这家国际IP巨头期待值和迫切需求感的一种具象。这来自于迪士尼授权业务在过去一年的精彩表现,过去一年,以620亿美金的零售表现,迪士尼继续领跑全球授权业;中国公司及其合作伙伴则先后获得2项亚洲授权业卓越大奖及3项中国授权业大奖。0000腾讯绝艺AI登顶日本麻将平台 AI决策能力提升
站长网2023-07-12 16:23:470000