阿里可控视频生成框架DreaMoving开源
站长网2023-12-21 10:44:040阅
今天,阿里可控视频生成框架DreaMoving正式开源,从网友测试的效果来看,其对人物运动的控制还是比较理想的。
据介绍,DreaMoving是基于扩散模型的可控视频生成框架,用于产生高质量定制的人类视频。DreaMoving允许用户生成具有高度自定义特征的人类视频,如在沙滩上微笑的女孩,中央公园跳舞的亚洲女孩等。
代码:https://github.com/dreamoving/dreamoving-project
试玩地址:https://www.modelscope.cn/studios/vigen/video_generation/summary
DreaMoving是一种可以生成高质量和高保真度视频的技术,它能够根据给定的指导序列和简单的内容描述,例如文本和参考图像作为输入,生成视频。
具体来说,DreaMoving通过人脸参考图像、通过姿势序列进行精确运动操作以及由指定文本提示提示的综合视频外观控制来展示身份控制的熟练程度。这意味着,只需要“投喂”一张人像和一段提示,就能够生成对应的视频,而且改变提示,人物背景和身上的衣服也会跟着变化。
为了实现这一目标,DreaMoving技术引入了两个关键组件:Video ControlNet和Content Guider。其中,Video ControlNet是一个图像ControlNet,通过在每个U-Net块后注入运动块,处理控制序列(姿势或深度)以产生额外的时间残差,从而有效实现了对运动的控制。而Content Guider组件则负责将输入文本提示和外观表达(如人脸,衣物是可选的)转换为内容嵌入,实现跨注意力的传递。
0000
评论列表
共(0)条相关推荐
LeCun嘲讽:称LLM为随机鹦鹉,是对鹦鹉的侮辱
鹦鹉已经学会给自己的朋友打电话了!美国东北大学的研究人员发现,鹦鹉会在想自己的鹤鹤朋友时,主动给它们打视频电话,这让它们感到很幸福。据了解,这项研究是由美国东北大学学生联合麻省理工学院、格拉斯哥大学开展的,18只鹦鹉参与了这项实验,它的摄影师会教它们如何使用平板电脑和手机互视频电话。站长网2023-04-24 17:02:120001欧盟扩大对AI初创公司的支持,提供超级计算机进行模型训练
划重点:-欧盟计划通过提供超级计算机的处理能力,支持本土AI初创公司进行模型训练。-这一计划的早期试点阶段已经有法国的MistralAI参与。-该计划需要为AI初创公司提供专门的支持,帮助他们更好地利用欧盟的高性能计算资源。欧盟计划通过提供超级计算机的处理能力,支持本土AI初创公司进行模型训练。该计划于去年9月宣布,并于上个月开始实施。0000vivo OriginOS 4下周发布!行业首发虚拟显卡:系统更流畅 支持光追
快科技10月29日消息,2023vivo开发者大会将于11月1日(下周三)举行,届时,全新系统OriginOS4会正式发布,Slogan为流畅好用,智有妙用”。vivo品牌副总裁贾净东透露,OriginOS4在计算机算法技术上更进一步。据介绍,OriginOS4行业首发虚拟显卡、异构计算空间等算法技术。站长网2023-10-29 09:09:520000苹果官网大降价 符合条件可退差价:仅限1月4日后购买设备用户
站长之家(ChinaZ.com)1月16日消息:迎新春限时优惠活动在苹果官网上线,从1月18日至21日,消费者可以享受最高800元的优惠。但这个优惠活动有一些特定的条件。站长网2024-01-16 10:32:280000爱诗科技完成亿级A1轮融资 并发布爱诗视频大模型
爱诗科技是一家专注于解决AI视频大模型及应用的公司,最近完成了亿级人民币A1轮融资。本轮融资由国内一线投资机构达晨财智领投,光源资本担任独家财务顾问。爱诗科技团队成员来自清华、北大、中科院等顶级学府,曾在字节、快手、腾讯、微软研究院等核心技术团队工作,拥有世界一流的计算机视觉算法攻坚能力和解决系统工程问题的经验。站长网2024-03-12 14:14:110000