新AI框架H2O:将人类动作实时转换为机器人动作 可行走、后空翻、踢球等
划重点:
1. 🔄 **框架介绍**:H2O(Human to Humanoid)是基于强化学习的框架,通过仅使用RGB摄像头实现了全尺寸人形机器人的实时全身遥控操作。
2. 🔄 **数据处理过程**:采用可扩展的“从模拟到实际”处理,通过特权模仿者筛选和选择可行的动作,构建了大规模的重定目标运动数据集。
3. 🔄 **实时遥操作实现**:在模拟环境中使用经过精炼的动作训练了鲁棒的全身机器人模仿者,并以零次试验方式将其转移到实际机器人,成功实现了在真实场景中的动态全身运动遥操作。
在最新的研究中,由卡内基梅隆大学的研究团队开发,提出了一种名为H2O(Human to Humanoid)的框架,通过强化学习实现了人对人形机器人的实时全身遥控操作。

该框架在仅使用RGB摄像头的条件下,成功地让人形机器人模仿并实时执行各种动态的全身运动,包括行走、后空翻、踢球、转身、挥手、推动、拳击等。

为了实现这一突破性的技术,研究团队提出了一种可扩展的“从模拟到实际”的处理过程,以构建大规模的人类运动数据集,为人形机器人提供实时遥操作的训练样本。在处理过程中,通过特权模仿者筛选和选择可行的动作,优化了人形机器人的身体模型,确保其对人类运动的高度还原性。

框架的核心包括三个关键阶段:首先,通过优化形状和运动参数,将SMPL(Skinned Multi-Person Linear model)身体模型与人形机器人的结构对齐,形成基础的运动数据集。其次,通过训练一个特权模仿策略,去除运动数据集中的异常和不可行的动作,生成更加真实和清晰的运动数据集。最后,通过在模拟环境中训练一个实时模仿策略,实现对人形机器人的零次试验遥操作。
实时遥操作的过程涉及使用RGB摄像头和姿势估计器捕捉人类运动,然后通过训练有素的模仿策略,使人形机器人能够即时模仿并执行这些运动。
这项研究不仅成功实现了全身运动的学习式实时遥操作,还展示了在真实世界情境中的应用,如左右踢球、递盒子、前行后跳、拳击等。据了解,这是首次在人形机器人领域实现了这一技术上的突破,为全新的人机交互和协作场景提供了有力的支持。
项目入口:https://top.aibase.com/tool/human-to-humanoid-h2o-
英伟达开源大模型对齐框架—NeMo-Aligner
随着ChatGPT、Midjourney等大模型产品的影响力、应用场景越来越多,为了确保输出的内容安全、可靠,对齐成为开发人员的关注重点和难点。但现在的模型参数少则几百亿多则上千亿,想通过传统的监督式微调方法来完成对齐效果往往不理想。站长网2024-05-13 09:35:300001由OpenAI支持的机器人公司1X获得1亿美元投资 计划推家庭服务机器人
**划重点:**1.🌐OpenAI支持的1X科技宣布完成B轮融资,共计1亿美元,投资方包括三星等大公司。2.🚀公司计划利用资金支持企业客户,并推出新型双足机器人“NEO”,旨在解决社会对劳动力需求不断增长的问题。3.🤖1X科技通过与OpenAI合作,采用语言和具象学习模型,使其机器人能够理解用户的自然语言指令,并执行相应任务,为企业和家庭提供智能服务。0000专家警告!AI约会工具LoveGPT或存在利用GPT虚构身份
要点:Avast网络安全专家警告LoveGPT,一款旨在进行在线约会的AI工具,可用于自动化虚假身份欺诈,诱使受害者泄露敏感信息,如信用卡详细信息。LoveGPT使用OpenAI的GPT语言模型创建令人信服的虚假档案和更真实的对话,使骗子能够在各种约会平台上扩大攻击规模。Avast建议在线约会时保持谨慎,建议用户不要信任新的在线联系人,即使他们看起来很真实,因为可能存在由AI驱动的虚假身份。站长网2023-10-10 09:58:580000“离婚搭子”走红,非公式化的内容探索
继饭搭子、游戏搭子、运动搭子之后,有一对“离婚搭子”近期也迅速走红,成为人们热议的话题。这一新兴词汇指的是那些经历过离婚,选择共同面对生活、相互支持的朋友。老刘和张硕,两位从离婚综艺节目走出来的嘉宾,自2024年起在小红书上分享他们作为“离婚搭子”的生活点滴,逐渐获得了关注。7月8日,@有个男的叫老刘与@张硕sss、在小红书上联合进行了一场直播带货,首播便冲上了买手榜的第一。站长网2024-09-08 09:53:050001微软专利:根据你的人体生成虚拟自我
微软最近获得了一项专利,介绍了一种使用传感器数据根据用户真实身体生成虚拟自我的技术。这项技术能够捕捉用户身体的运动和位置信息,然后将其映射到一个虚拟模型上,以创造出一个超逼真的虚拟身体。这种虚拟身体不仅外观真实,而且能够模仿用户的动作和姿态。它通过优化算法和预训练来实现用户运动到虚拟身体运动的准确映射。这种技术的应用前景广阔,包括沉浸式社交平台、虚拟现实体验、运动追踪等。站长网2023-10-20 15:04:470001