细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型
要点:
MoMask是一个文本驱动的3D人体动作生成模型,采用层级量化方案表示动作,包括基础层的运动标记和逐层存储的残差标记。
模型包括Masked Transformer和Residual Transformer,用于在训练阶段通过文本输入预测基础层的随机掩码动作标记,并在生成阶段填充缺失标记,并逐渐预测更高层次的标记。
MoMask在文本到运动生成任务中表现优越,例如在HumanML3D数据集上,其FID为0.045,明显优于T2M-GPT的0.141。此外,MoMask还能无缝应用于相关任务,如文本引导的时间修复。
MoMask是一个创新的3D人体运动生成模型,其核心思想是通过层级量化方案表示人体动作,包括基础层和逐层的残差标记。在模型结构上,引入了Masked Transformer和Residual Transformer,分别用于预测基础层的掩码动作标记和逐渐预测更高层次的标记。这一框架使得MoMask在文本到运动生成任务中表现卓越。
MoMask的应用不仅局限于文本到运动生成,还展示了在文本引导的时间修复任务中的出色表现。通过展示中,模型成功地完成了对动作片段中特定区域的修复,根据文本描述 inpaint 了中间、后缀和前缀区域,呈现出令人满意的合成效果。
项目地址:https://github.com/EricGuo5513/momask-codes
在实验结果分析中,MoMask通过对残差量化层的变化进行研究,展示了其对运动标记的高保真重建能力。生成方面的比较进一步证明了残差标记的重要性,MoMask在不同组合的标记下能够更准确地执行微妙的动作,相较于其他基线模型表现更为出色。
论文通过对比MoMask与其他三种强基线方法,包括扩散模型和自回归模型,证明了MoMask在捕捉语言概念和生成更真实动作方面的优越性。这使得MoMask成为文本驱动的3D人体运动生成领域的先进模型。
MoMask通过引入层级量化和Transformer结构,在文本驱动的3D人体运动生成任务中取得了显著的性能提升,同时在相关任务上也展现了出色的通用性。其在重建、生成和比较方面的实验证明了其在3D人体动作建模领域的卓越性能。
百度智能云企业知识管理平台“甄知”通过信通院大模型专项评估
百度宣布,百度智能云旗下的企业知识管理平台“甄知”成为行业首个通过中国信通院基于大模型的知识管理专项评估的产品。甄知获得了优秀级(4级)的评分,也是该次评估中的最高等级。评估涉及3个能力域,包括数据处理、知识抽取、知识融合、知识推理、知识建模、知识库自动构建等流程,覆盖了智能搜索、智能问答、智能生成等智能应用。站长网2024-03-08 18:05:220000李斌:蔚来手机是防御策略 第二代研发工作已经完成
蔚来汽车董事长李斌在近日于武汉举行的车主聚会上,为在场的车主们带来了蔚来品牌的最新动态。他透露,蔚来第二代手机的研发工作已经完成,并已顺利进入制造阶段,虽然距离正式发布尚需时日,但蔚来每年都将按计划推出一款新手机,而非多款。站长网2024-03-19 17:52:180000评论数达10万!Redmi K70京东好评率超98%
小米公司王腾近日在微博上盛赞RedmiK70,称其为2-3K价位中口碑和销售最好的产品之一。据他透露,该机在京东平台上的评论数已达10万,好评率高达98%以上,如此出色的销量和口碑,背后正是其全面领先的产品力。王腾强调,RedmiK70在性能、屏幕和主摄方面都表现出色,堪称同档位无敌。该机还搭载了全新的小米澎湃OS,为用户带来流畅的体验,并可尽享小米全生态智能体验。0000新能源汽车卖疯了 比亚迪一季度利润大涨410%:问鼎全球销冠
快科技4月27日消息,比亚迪发布了2023年一季度财报,营收1201.7亿元,同比增长79.83%;净利润41.3亿元,同比增长410.89%;基本每股收益1.42元。比亚迪表示,营收增长主要是新能源汽车销量增长所致。该公司此前发布的3月份报告显示,新能源汽车销量20.7万辆,本年累计销量55.2万辆,同比增长92.81%。2023年3月海外销售新能源乘用车合计1.33万辆。站长网2023-04-27 22:09:050000Real AI发布欧洲首个人本主义开源大语言模型项目HOMINIS
**划重点:**1.🖥️LEONARDO超级计算机将支持RealAI建设欧洲首个人本主义大语言模型HOMINIS。2.🌍项目HOMINIS旨在构建道德、无偏见的AI系统,减少环境影响。3.🤝RealAI与UNINA和NVIDIA合作,致力于推动创新解决方案,涵盖多个领域。站长网2023-11-23 16:52:100000