阿里出品!DreaMoving:图片+文字提示就能生成高质量舞蹈视频
**划重点:**
1. 🌐 **框架介绍:** DreaMoving是一种基于扩散模型的可控视频生成框架,基于图文就能制作高质量定制的人类跳舞视频视频。
2. 🔄 **架构解析:** 文中提出了Video ControlNet和Content Guider两大关键组件,分别负责运动控制和身份保留,可适用于各种风格化的扩散模型。
3. 🎬 **成果展示:** DreaMoving通过姿势序列和简单的内容描述,如文本和参考图像,生成高质量、高保真度的定制视频。
DreaMoving由阿里巴巴集团的一组研究人员倾力打造,一种基于扩散模型的可控视频生成框架,。该框架的核心目标基于图文就能生成高质量、定制化的人类舞蹈视频。
DreaMoving以其出色的扩散模型为基础,能够根据人物的身份和姿势序列生成目标身份在任何地方跳舞的视频。
DreaMoving 可以生成高质量和高保真度的视频,给定指导序列和简单的内容描述,例如文本和参考图像作为输入。具体来说,DreaMoving 通过人脸参考图像、通过姿势序列进行精确运动操作以及由指定文本提示提示的综合视频外观控制来展示身份控制的熟练程度。
比如你“投喂”一张人像,以及一段prompt就能生成对应的视频,而且改变prompt,人物背景和身上的衣服也会跟着变化。
为实现这一目标,该技术引入了Video ControlNet和Content Guider两个关键组件。
Video ControlNet:这是一个图像ControlNet,通过在每个U-Net块后注入运动块,处理控制序列(姿势或深度)以产生额外的时间残差。这有效实现了对运动的控制。
Content Guider:该组件负责将输入文本提示和外观表达,如人脸(衣物是可选的),转换为内容嵌入,实现跨注意力的传递。

值得一提的是,目前DreaMoving项目并没有开源代码。点击前往DreaMoving官网体验入口
项目网址:https://dreamoving.github.io/dreamoving/
论文网址:https://arxiv.org/abs/2312.05107
中国互联网大厂的“ChatGPT”追赶之旅现状
站长网2023-05-04 09:16:060000AI 大模型落地尚需时间 预计未来投资重心逐渐向云计算和软件 SaaS 领域迁移
站长之家(ChinaZ.com)10月8日消息:中信证券日前发布研究报告称,伴随AI应用逐渐向纵深方向演进,投资机会将从GPU产业链进一步扩展至云计算、数据中心IDC、液冷等产业链。预计智能云占比较高的云计算公司将受益。站长网2023-10-08 18:03:260002麻省理工研究员在机器学习模型隐私保护方面取得突破
站长网2023-07-18 17:48:290001科学家利用GPT AI解码人类思维 读心术可能成真!
德克萨斯大学奥斯汀分校的研究人员ChatGPT的生成式预训练Transformer(GPT)AI模型,从功能性MRI(fMRI)记录中重建人类思想,准确率高达82%,从而取得了突破性发现。研究与方法论站长网2023-05-04 10:52:100000小米Civi 4 Pro迪士尼一周年特别版官宣 下周正式发布
小米产品经理胡馨心宣布小米Civi4Pro迪士尼公主版即将在下周正式发布,以庆祝与迪士尼合作一周年的里程碑。这款定制新品在设计上充分融合了迪士尼公主IP的梦幻元素,不仅在外观上展现出联名特色,还预装了迪士尼公主IP主题及UI,为用户带来沉浸式的公主世界体验。此外,官方还可能新增名为“白雪公主”的特殊相机水印,让每一次拍摄都充满童话色彩。站长网2024-05-31 16:49:430000