首个人体动捕基模型SMPLer-X面世 可捕捉身体甚至面部动作
站长网2023-10-30 15:04:272阅
要点:
1. 首次提出了动捕大模型SMPLer-X,用来进行人体全身姿态与体型估计,通过训练450万个实例,在七个关键榜单上取得最佳性能。
2. SMPLer-X不仅能够捕捉身体动作,还可以输出面部和手部动作,并估计体型。
3. 该研究探索了数据缩放与模型缩放,对32个学术数据集进行排名,展示了在各种测试和榜单中的强大性能。
首个人体动捕基模型SMPLer-X在NeurIPS2023上亮相。本研究首次针对人体全身姿态与体型估计任务引入了SMPLer-X,通过使用来自多个数据源的450万个实例进行训练,成功刷新了七个关键榜单的最佳性能。
项目地址:https://caizhongang.github.io/projects/SMPLer-X/
SMPLer-X不仅能够进行身体动作捕捉,还可以输出面部和手部动作,甚至估计体型。这一模型的强大性能得益于大量的数据和大型模型,即使在未知环境中也表现出出色的通用性。
研究人员在研究中进行了数据扩展、模型缩放以及微调策略的探索,以进一步提高模型性能。通过对32个不同的学术数据集进行排名,SMPLer-X在关键榜单上实现了最佳性能,并展示了数据缩放和模型缩放的有效性。
这个研究还强调了数据集的泛化性研究,指出在模型训练中使用10万个实例数量级的数据集可以获得高性价比。此外,对不同数据集的采集场景和标注也进行了详细研究,强调了生成数据集和伪标签数据集的重要性。
总的来说,SMPLer-X的提出和研究为人体动捕领域带来了重要的突破,为学术社区提供了强大的全身人体动捕大模型。该研究的代码和预训练模型已经开源,为更广泛的应用提供了便利。这一成果不仅可以用于角色动画制作,还在许多其他领域具有潜在的应用前景。
0002
评论列表
共(0)条相关推荐
创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景
Gaussian-SLAM是一项新兴技术,可以通过分析视频流中的图像来创建逼真的3D模型,从而重建现实世界场景。通过观看一个视频,Gaussian-SLAM可以分析视频中的图像,能够理解视频中的环境布局和物体的位置。然后利用这些图像数据来创建、还原可以从各个角度观察的3D模型,重建现实世界场景。这一过程是实时渲染的,可以帮助用户在计算机上查看和探索3D虚拟环境。站长网2023-12-19 10:47:410000大型科技公司在2023年人工智能投资狂潮中的支出超过了风险投资公司
**划重点:**1.🚀**巨头崛起:**微软、谷歌和亚马逊去年在人工智能领域达成一系列巨额交易,占据了2023年新兴AI公司筹集的270亿美元中的三分之二。2.💰**投资激增:**在OpenAI的ChatGPT于2022年11月推出后,这一庞大的投资规模快速增长,突显出硅谷巨头如何挤占传统科技投资者在行业最大交易中的份额。0000支付宝全新Logo发布 以“开放、科技、温暖”为理念焕然一新
站长之家(ChinaZ.com)1月19日消息:今日,支付宝在其官方微博上正式宣布进行Logo全新升级。围绕“开放、科技、温暖”三大核心理念,新Logo以更开放、流畅和现代的设计风格展现,引入自然光立体效果,传递信任与温暖的感受。*站长网2024-01-19 14:35:180000抖音测试“顺手价”功能 深化布局本地生活市场
据新浪科技报道,抖音本地生活近期正在内测"顺手价"功能,为用户提供更多优惠选择,同时为商家带来新的流量机会。据抖音内部人士确认,该功能目前正在测试阶段。"顺手价"功能将在用户完成团购订单支付后,在订单页面推荐1公里范围内的其他团购商品,价格低于常规团购价。这一功能被官方称为"顺路消费,专享优惠"。站长网2024-07-16 14:28:390001突飞猛进的运营商云:一边下沉,一边搞AI基建
运营商云们来势汹汹,2023上半年,天翼云总体营收已经逼近中国第一的阿里云,云市场的竞争规则正在改变,格局也将很快进入动荡期。上周,三大运营商扎堆发布了2023年半年报,其中,云业务的增长仍然是财报中的亮点。财报显示,2023年上半年,天翼云营收459亿元,同比增长63.4%,移动云营收422亿元,同比增长80.5%;联通云营收255亿元,同比增长36%。站长网2023-08-17 09:11:300000