3DHM框架：一图片可模仿任意视频动作 360度无死角

站长网2024-01-29 14:16:570阅

划重点:

- 无需标注数据，3DHM框架即可让照片动起来，模仿目标视频动作，衣服动起来也真实!

- 研究人员提出了一个两阶段的、基于扩散模型的框架3DHM，通过从单个图像完成纹理图来合成3D人体运动，然后渲染3D人体以模仿视频中actor的动作。

- 该方法在生成长时间运动和各种高难度的姿势上更有弹性，对视频图像渲染更加逼真。

加州大学伯克利分校的研究人员最近发布了一个名为3DHM的框架，能够让一张图片动起来，模仿任意视频动作，即使是视频中的衣服也能够运动得非常真实。

这一框架无需标注数据，通过从单个图像完成纹理图来合成3D人体运动，然后渲染3D人体以模仿视频中actor的动作。通过这种方法，研究人员能够在生成长时间运动和各种高难度的姿势上更有弹性，对视频图像渲染更加逼真。

为了解决这个问题，研究人员使用填充扩散模型，在给定的单张图像中想象出不可见部分，然后在纹理图空间上训练该模型，在姿势和视点不变的条件下提升采样效率。

他们还开发了一个基于扩散模型的渲染pipeline，由3D人体姿势控制，从而可以生成目标人物在不同姿势下的逼真渲染，包括衣服、头发和看不见区域下的合理填充。实验结果表明，相比以前的方法，该方法在生成长时间运动和各种高难度的姿势上更有弹性。

在具体实现上，研究人员首先利用一种常用的方法来推断像素到表面的对应关系，从而建立一个不完整的UV纹理图，用于从单张RGB图像中提取三维网格纹理。同时计算可见性掩码，以显示哪些像素在3D中可见，哪些不可见。接着，通过生成伪完整纹理贴图来渲染人物。

在第二阶段，他们通过收集大量的配对数据训练第二阶段扩散模型，以获得一个模仿actor动作的人的逼真渲染效果。

这种方法使得他们能够在生成具有生动纹理的真人图像上取得良好的效果。

论文网址：https://arxiv.org/abs/2401.10889

3DHM框架一图片可模仿任意视频动作360度无死角

0000

评论列表

共(0)条

相关推荐

卢伟冰回应发布会上误喊3000：真不是小米15 Pro的成本价
近日，小米集团卢伟冰在一场直播中回应了小米15Pro发布会上误报价格的事件。卢伟冰表示，3000元并不是小米15Pro的成本价格。他指出，小米15Pro的成本上涨明显高于售价上涨的幅度，并且在发布会彩排时没有确定价格，而发布当天他嗓子不舒服，导致误报了价格。卢伟冰还透露，3开头的价格将由Redmi负责，暗示RedmiK80系列的价格将在3000-4000元之间。
站长网站长资讯2024-11-17 10:40:50
0000
站长资讯
B站百万粉UP主“老蒋巨靠谱”：“太精致的内容不会火”是一种粗糙趋势下的误判
粗糙or精品，哪一种才是视频内容的未来?B站百万粉UP主“老蒋巨靠谱”（本名蒋松筠）自称是一个粗糙的视频创作者。他当过媒体人和评论员，也为虎嗅、创业邦等多家知名平台撰过稿，后来从0经验开始做视频，凭借对社会热点和财经趋势的深度评论，在B站收获了百万粉丝，其中“解构B站”相关内容播放量超百万。
站长网2024-01-30 15:56:28
0000
不到24小时极速访华！马斯克的时间管理有多厉害
快科技5月1日消息，成功人士的时间管理都很强，而马斯卡作为其中的佼佼者，更是拥有自己独特的方法论。据央视新闻报道，4月28日下午，应中国贸促会邀请，特斯拉首席执行官埃隆马斯克抵达北京，次日下午13:17，马斯克的飞机从北京首都机场起飞，离开中国。
站长网站长资讯2024-05-02 22:47:28
0000
站长资讯
阿里推虚拟试穿技术Outfit Anyone 加上Animate Anyone轻松拿捏换装视频
要点:OutfitAnyone采用双流条件扩散模型，处理模特、服装和文本提示，通过衣物图像作为控制因素实现更逼真的虚拟试穿效果。该技术在处理服装变形方面表现出色，具有可扩展性，可调节因素包括姿势和身体形状，适用范围涵盖从动漫到真实场景的多种图像。
站长网2023-12-14 14:25:07
0009
站长资讯
快手发布2024年第二季度财报：营收310亿元同比增长11.6%
快手科技今日公布了其截至2024年6月30日的第二季度财报，营收达到310亿元人民币，与去年同期相比增长了11.6%。净利润方面，公司实现了显著的同比增长，由去年同期的15亿元增至40亿元。在非国际财务报告会计准则下，调整后的净利润为46.79亿元，去年同期为26.94亿元。
站长网2024-08-20 17:52:40
0000