阿里出品!DreaMoving:图片+文字提示就能生成高质量舞蹈视频
**划重点:**
1. 🌐 **框架介绍:** DreaMoving是一种基于扩散模型的可控视频生成框架,基于图文就能制作高质量定制的人类跳舞视频视频。
2. 🔄 **架构解析:** 文中提出了Video ControlNet和Content Guider两大关键组件,分别负责运动控制和身份保留,可适用于各种风格化的扩散模型。
3. 🎬 **成果展示:** DreaMoving通过姿势序列和简单的内容描述,如文本和参考图像,生成高质量、高保真度的定制视频。
DreaMoving由阿里巴巴集团的一组研究人员倾力打造,一种基于扩散模型的可控视频生成框架,。该框架的核心目标基于图文就能生成高质量、定制化的人类舞蹈视频。
DreaMoving以其出色的扩散模型为基础,能够根据人物的身份和姿势序列生成目标身份在任何地方跳舞的视频。
DreaMoving 可以生成高质量和高保真度的视频,给定指导序列和简单的内容描述,例如文本和参考图像作为输入。具体来说,DreaMoving 通过人脸参考图像、通过姿势序列进行精确运动操作以及由指定文本提示提示的综合视频外观控制来展示身份控制的熟练程度。
比如你“投喂”一张人像,以及一段prompt就能生成对应的视频,而且改变prompt,人物背景和身上的衣服也会跟着变化。
为实现这一目标,该技术引入了Video ControlNet和Content Guider两个关键组件。
Video ControlNet:这是一个图像ControlNet,通过在每个U-Net块后注入运动块,处理控制序列(姿势或深度)以产生额外的时间残差。这有效实现了对运动的控制。
Content Guider:该组件负责将输入文本提示和外观表达,如人脸(衣物是可选的),转换为内容嵌入,实现跨注意力的传递。
值得一提的是,目前DreaMoving项目并没有开源代码。点击前往DreaMoving官网体验入口
项目网址:https://dreamoving.github.io/dreamoving/
论文网址:https://arxiv.org/abs/2312.05107
报道称微软2024年将大举采购英伟达新款AI芯片B100
国外媒体最新报道显示,微软计划在2024年通过采购大量英伟达最新款AI加速芯片B100,来最大化提升其AI计算性能。此前微软已订购了15万颗英伟达H100芯片,但考虑到B100的计算力预计可达H100的两倍以上,微软决定将部分H100订单转移至新款B100芯片。0000群友在群聊发捂嘴笑表情被起诉 法院:未侵权 驳回请求
据法治网消息,近日,一场微信群聊对话引发了一场官司,原因是因为一个表情符号。江苏的张某和李某是微信群的群友,某天李某在群聊中提到张某并称其坏人,同时配上了咧嘴笑和捂嘴笑的表情符号。次日,张某以侵犯名誉权为由向法院提起诉讼,要求李某在群聊中和报刊上公开道歉并赔偿损失。法院判决认为李某的行为并未侵犯张某的名誉权,驳回了张某的诉讼请求。站长网2023-10-11 17:30:580000英特尔宣布推出「AI PC 加速计划」助力开发更多人工智能应用
站长之家(ChinaZ.com)10月20日消息:英特尔日前宣布推出名为「AIPCAccelerationProgram」(AIPC加速计划),旨在激发开发者的创新潜力,借助即将于今年12月发布的CoreUltra系列笔记本电脑处理器,打造更多可应用人工智能技术的应用服务。站长网2023-10-20 15:44:080003航旅纵横发布民航领域垂直大模型“千穰大模型”
航旅纵横发布了首个民航领域垂直大模型——千穰大模型。该大模型基于Transformer架构,构建了10亿、100亿、300亿等多种参数模型,融合了视觉大模型、语言大模型、多模态大模型和计算大模型,通过强大的人工智能技术,为民航产业的数智化建设和旅客的智慧出行提供支持。站长网2023-08-26 17:01:250001年轻人捧热轻徒步,主打社交与治愈
“五一”假期,游人如织。据交通部门初步统计显示,5月1日至5日,全社会跨区人员流动量预计约13.6亿人次,人头攒动的背后是旅游市场从复苏走向繁荣的迹象。在这当中,出入境旅游与跨省旅游虽然依旧是热度不减的玩法,但也有不少人将步调放缓,把自己“扔”进了更纯粹的山川湖海里。在户外运动关注度日益攀升的当下,轻徒步对年轻人的吸引力更是成倍攀升。站长网2024-05-08 07:15:090000