微软AI研究提出AI模型HMD-NeMo:可基于部分手部动作准确生成全身动作
**划重点:**
1. 🌐 微软Mixed Reality & AI Lab的研究人员提出HMD-NeMo,一种新的神经网络模型,能够在手部部分可见的情况下生成真实和准确的全身动作。
2. 🧠 HMD-NeMo采用时空编码器和新颖的可调节时间蒙版token(TAMT),在实时和在线情景下操作,解决了虚拟现实中全身动作生成的挑战。
3. 🚀 该方法通过在Motion Controllers和Hand Tracking等场景下进行广泛评估,并在多个数据集上超越现有方法,展示了其在解决虚拟现实中生成全身动作的问题上的重要进展。
在混合现实场景中,生成准确和真实的全身虚拟角色动作一直是一个持久性的挑战。传统解决方案通常使用头戴式设备(HMDs),依赖有限的输入信号,如头部和手部的6自由度(DoF)。然而,最近的进展在从头部和手部信号生成全身动作方面取得了令人印象深刻的表现。然而,它们普遍存在一个共同的限制,即假设手部完全可见。这一假设在手部跟踪依赖于自我中心传感器的情况下成立,由于HMD的有限视野,导致手部部分可见。
来自微软Mixed Reality & AI Lab的研究人员引入了一种创新的方法 - HMD-NeMo(HMD神经运动模型)。这一统一的神经网络能够在手部仅部分可见的情况下生成真实和准确的全身动作。HMD-NeMo实时在线运行,适用于动态混合现实场景。
HMD-NeMo的核心是一种时空编码器,具有新颖的可调节时间蒙版令牌(TAMT)。这些令牌在没有手部观测的情况下鼓励生成真实的动作。该方法采用循环神经网络高效捕捉时间信息,并使用变压器模型复杂地建模不同输入信号组件之间的关系。
研究纸提出了两种评估场景:Motion Controllers(MC),其中使用运动控制器跟踪手部,和Hand Tracking(HT),其中使用自我中心手部跟踪传感器跟踪手部。结果表明,HMD-NeMo是第一种能够在统一框架内处理这两种情况的方法。在HT场景中,即使手部可能完全或部分不在视野中,可调节时间蒙版token在维持时间连贯性方面表现出色。
该方法使用损失函数进行训练,考虑数据准确性、平滑度以及在SE(3)中进行人体姿势重建的辅助任务。实验证明了HMD-NeMo在AMASS数据集上的出色性能,该数据集包含转换为3D人体网格的大量人体运动序列。采用关节位置误差(MPJPE)和关节速度误差(MPJVE)等指标评估HMD-NeMo的性能。
与运动控制场景中的最先进方法进行比较显示,HMD-NeMo实现了更高的准确性和更平滑的动作生成。此外,通过跨数据集的评估,证明了该模型的泛化能力,在多个数据集上优于现有方法。
深入研究了不同组件的影响,包括TAMT模块在处理缺失手部观测方面的有效性。研究表明,HMD-NeMo的设计选择,如时空编码器,对其成功起到了重要作用。
HMD-NeMo在解决混合现实场景中生成全身虚拟角色动作的挑战方面迈出了重要的一步。其在处理运动控制和手部跟踪等多种场景中的多功能性,以及出色的性能指标,使其成为该领域的开创性解决方案。
论文网址:https://www.microsoft.com/en-us/research/publication/hmd-nemo-online-3d-avatar-motion-generation-from-sparse-observations/
牛!S-LoRA技术实现单GPU运行数千个LLM,个性化服务AI应用
**划重点:**1.🌐S-LoRA技术由斯坦福大学和加州大学伯克利分校的研究人员合作开发,可显著降低LLM精细调整的成本,使企业能够在单个GPU上运行数百甚至数千个模型。2.⚙️S-LoRA通过动态内存管理系统和"UnifiedPaging"机制解决了部署多个LoRA模型时的技术挑战,支持在单个GPU或多个GPU上服务多个LoRA适配器。站长网2023-11-15 18:08:580001谷歌大杀器终于来了,最大规模Gemini震撼发布:真超GPT4,三大版本,手机直接可用
时代变了?迄今为止规模最大,能力最强的谷歌大模型来了。当地时间12月6日,谷歌CEO桑达尔・皮查伊官宣Gemini1.0版正式上线。这次发布的Gemini大模型是原生多模态大模型,是谷歌大模型新时代的第一步,它包括三种量级:能力最强的GeminiUltra,适用于多任务的GeminiPro以及适用于特定任务和端侧的GeminiNano。站长网2023-12-07 09:14:290000首发骁龙8 Gen4!小米15 Pro规格揭晓:5000万像素潜望长焦三摄组合
快科技5月13日消息,据此前爆料,高通骁龙8Gen4的进展非常迅速,将于10月份正式登场,首发旗舰9月进入量产。不出意外的话,这次依然是小米15系列拿下全球首发,依然是两款齐发。小米15主打小尺寸直屏,小米15Pro则主打全面水桶旗舰,采用曲屏方案。据博主数码闲聊站”最新爆料,小米15Pro工程机这次采用左上角方形Deco,但闪光灯将独立在模组之外。站长网2024-05-13 10:21:37000012306推出学生务工人员春运专区预约购票功能
铁路12306手机客户端将从1月10日起推出春运期间学生、务工人员专区预约购票功能。学生旅客可以通过“学生寒假订票专项服务”预约购买春运期间的火车票,每名旅客最多可同时提交6个预约订单,可选择的席别为学生优惠票适用的硬座、硬卧和二等座。站长网2024-01-10 15:56:190000谷歌发布基础世界模型Genie:11B参数,单张图生成可交互的虚拟世界
要点:1、谷歌发布了基础世界模型Genie,拥有110亿参数,可以生成可交互的虚拟世界。2、Genie可以在没有动作标签的情况下学习控制,并且培养下一代的创作者。3、谷歌表示Genie是一种通用方法,可以应用于多个领域,不需要额外的领域知识。站长网2024-02-27 09:34:010001