登陆注册

文本驱动的3D人体运动生成模型

  • 细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型

    要点:MoMask是一个文本驱动的3D人体动作生成模型,采用层级量化方案表示动作,包括基础层的运动标记和逐层存储的残差标记。模型包括MaskedTransformer和ResidualTransformer,用于在训练阶段通过文本输入预测基础层的随机掩码动作标记,并在生成阶段填充缺失标记,并逐渐预测更高层次的标记。
    站长网2023-12-06 10:37:42
    0000