阿里可控视频生成框架DreaMoving开源
站长网2023-12-21 10:44:040阅
今天,阿里可控视频生成框架DreaMoving正式开源,从网友测试的效果来看,其对人物运动的控制还是比较理想的。

据介绍,DreaMoving是基于扩散模型的可控视频生成框架,用于产生高质量定制的人类视频。DreaMoving允许用户生成具有高度自定义特征的人类视频,如在沙滩上微笑的女孩,中央公园跳舞的亚洲女孩等。

代码:https://github.com/dreamoving/dreamoving-project
试玩地址:https://www.modelscope.cn/studios/vigen/video_generation/summary
DreaMoving是一种可以生成高质量和高保真度视频的技术,它能够根据给定的指导序列和简单的内容描述,例如文本和参考图像作为输入,生成视频。
具体来说,DreaMoving通过人脸参考图像、通过姿势序列进行精确运动操作以及由指定文本提示提示的综合视频外观控制来展示身份控制的熟练程度。这意味着,只需要“投喂”一张人像和一段提示,就能够生成对应的视频,而且改变提示,人物背景和身上的衣服也会跟着变化。
为了实现这一目标,DreaMoving技术引入了两个关键组件:Video ControlNet和Content Guider。其中,Video ControlNet是一个图像ControlNet,通过在每个U-Net块后注入运动块,处理控制序列(姿势或深度)以产生额外的时间残差,从而有效实现了对运动的控制。而Content Guider组件则负责将输入文本提示和外观表达(如人脸,衣物是可选的)转换为内容嵌入,实现跨注意力的传递。
0000
评论列表
共(0)条相关推荐
Apple Store小程序上线,苹果终于被微信「拿捏」了?
7月11日,微信官方公众号「微信派」发文宣布,苹果AppleStore官方在线商店在微信小程序上线,用户可以在小程序上直接购买苹果的全线产品,包括iPhone14系列、Mac和iPad等。站长网2023-07-12 17:37:040000人工智能将面孔识别技术带入动物界:AI 被用来识别鹅的面孔
站长之家(ChinaZ.com)11月6日消息:维也纳大学的生物学家SoniaKleindorfer博士,现任KonradLorenz行为与认知研究中心主任,最近发起了一项突破性研究。继承了著名的奥地利生物学家KonradLorenz研究灰雁鹅群行为的遗产,Kleindorfer博士及其团队开发了一种用于灰鹅面部识别的人工智能工具,旨在提高对鹅群个体识别的准确性。站长网2023-11-06 12:08:540000雷军也没抢到SU7Ultra车模:产能低 被加价到上千元
小米公司的创始人雷军今日在微博上分享了一组小米SU7Ultra车模的照片,并在评论区表达了自己未能抢购到车模的遗憾。这款小米SU7Ultra车模以1:18的比例精确复制了量产车型,采用合金材质制作,共有三种版本供消费者选择:标准版售价599元、礼盒版799元、尊享版999元。站长网2024-11-02 10:43:560000摩根士丹利预测特斯拉人工智能革命将迎来爆炸性增长
划重点:🔍摩根士丹利的研究报告指出,人工智能正处于爆炸性增长的时刻。🔍特斯拉最近发布了其双足机器人“Optimus”的新升级,摩根士丹利的研究人员相信这将引发特斯拉的“寒武纪爆炸”,从而实现爆炸性增长。🔍摩根士丹利建议投资者购买特斯拉股票,认为该公司处于弱势之中。0000