北大全新「机械手」算法:辅助花式抓杯子,GTX 1650实现150fps推断|NeurIPS 2023
手是人类与世界交互的重要部分,手的缺失(如上肢残障)会大大影响人类的正常生活。
北京大学董豪团队通过将扩散模型和强化学习结合,使机械手能根据人手腕部的移动轨迹,自适应的抓取物体的不同部位,满足人类多样化的抓取需求,目前该工作已被NeurIPS2023接收。
论文地址:https://arxiv.org/abs/2309.06038
项目主页:https://sites.google.com/view/graspgf
有了这个机械手,只要动动手腕,机械手就能按照人类想要的方式抓起物体,比如抓取杯身和杯壁。
由于人类行为的复杂与多变性和真实世界物体的多样性,仅仅根据人手腕部的移动轨迹来不断预测人类想法是一件非常困难的事情。
新方法真正实现了灵巧的抓取,能在真实世界中对于不同的物体,不同的抓取姿态,不同的抓取轨迹进行泛化。
机械手如何明白人类的想法?
北大董豪团队提出将人类的想法分解成两个部分:
1. 如何抓: 考虑到人类和物体当前的相对姿势,机械手应该如何抓取物体?
2. 何时抓: 机械手应该根据用户历史运动轨在何时、以什么速度执行抓取动作?
如何抓?
首先,如上图所示,新方法将学习人类想要「如何抓取物体」,定义为从一个包含各种抓取姿态的数据集中,学习抓取梯度场Grasping Gradient Field(GraspGF)。
基于当前人手腕部和物体的相对关系,GraspGF会输出一个梯度,这个梯度代表最快提高「抓取可能性」的方向。这个梯度可以转化为对每个手指关节的原始控制,使手指能够通过不断迭代达到适当的抓取姿态。
这样的梯度场可以随着人手腕部和物体的关系的变化,而不断的输出新的梯度指示当前人类的抓取意图,即意向抓取的物体区域及抓取姿态。
GraspGF随着手腕的旋转,不断调整抓取姿态
何时抓?
GraspGF的动作会导致提前合拢
然而,只知道「如何抓」并不够完备,如果不知道要「何时抓」(如上图所示),虽然最终的抓取姿态是合理的,但是在达到抓取姿态的过程中会和物体发生碰撞。
如上所示,为了解决「何时抓取」的问题,新方法还训练了一个基于强化学习的残差策略,它首先会输出一个「缩放动作」,根据手腕轨迹的历史,决定手指关节应该以多快的速度沿着原始动作的方向移动。
此外,因为原始策略是基于最终抓取姿态数据集离线训练得到的,原始策略并不了解环境的物理约束 ,残差策略还会输出一个「残差动作」来进一步校正原始动作。
通过结合残差策略,模型能够通过残差策略学习到的「何时抓」更好地实现原始策略学习到的「如何抓」。
简单的奖励函数
该方法在奖励函数的设置上不需要过多的human design,因为原始动作已经提供了一个比较好的「如何抓」的引导,在训练强化学习模型时,除了给定成功抓取和抓取后的高度变化奖励,仅仅只需要一个奖励函数去鼓励机械手跟随原始动作即可。
该方法的优势
该方法仅需要成功抓取的抓取姿态数据集用于训练,与需要专家演示的方法相比,不需要大量的人工标注或者工程工作。
GraspGF借助了扩散模型强大的条件生成建模能力,这使它能够根据新颖的用户意图输出有效的原始动作。
残差学习的设计改善了强化学习探索效率低下的问题,提升了强化学习模型在未见过物体和轨迹上的泛化能力。
结果
最终在4900多个物体,200条不同的人类移动轨迹上,新方法都优于基准。
该方法的最终的抓取姿态相比于基线更符合人类的抓取意图。
此外,该方法在抓取过程中对物体造成的扰动要小于其他基准。
经过测试,该模型在GTX1650的显卡上,能达到150fps的推断速度,能做到与人类的实时交互,也许未来能真正用于辅助手部缺失的人更好地进行日常生活。
本次研究的通讯作者董豪是北京大学的助理教授、博导、博雅青年学者、智源学者,其创立并领导北大超平面实验室(Hyperplane Lab)。
董老师在NeurIPS、ICLR、CVPR、ICCV、ECCV、ICRA、IROS等国际顶尖会议/期刊上发表论文40余篇,Google Scholar引用4700余次,多次担任国际顶尖会议如NeurIPS、CVPR、AAAI、ICRA的领域主席和副编委。
其领导了多个开源项目,例如TensorLayer和OpenMLsys,出版书籍获得15万次下载,开源软件获得上万Github Star,获ACM Multimedia 最佳开源软件奖、OpenI杰出项目奖。
论文一作吴天昊,现为北京大学博士生,导师为董豪老师,研究方向为灵巧手操纵算法。
在艰难的2023,私域是提供稳定增量的来源
2023年中,参与调研的超6成企业表示其私域带来收入贡献更高。如果放在艰难的市场环境中,会发现私域已经成为企业必然追加投入的务实方向。当下能带来增长的方法——不仅是利润,还包括对其他渠道的帮助——不会很多,私域是极少数还能提供稳定增量的来源。如果放在产业自身发展的角度看,则站在私域基础上,全域这个新提法为什么会开始成为业内讨论和关心的话题,就变得不言而喻——企业希望增长能持续、长期。0001全球最强长文本大模型,一次可读35万汉字:Baichuan2-192K上线
大模型看书,从来没有这么快过。国内大模型创业公司,正在技术前沿创造新的记录。10月30日,百川智能正式发布Baichuan2-192K长窗口大模型,将大语言模型(LLM)上下文窗口的长度一举提升到了192Ktoken。站长网2023-11-01 17:08:090000遥望科技:在小冰公司加持下 虚拟人互动等方面均取得突破
遥望科技在投资者互动平台上表示,公司已于2023年5月15日与小冰公司达成了战略合作。双方将共同探究在直播、短视频、直播电商、传统电商和新零售等领域的人工智能合作,实现长期合作和共同发展。此次合作主要涉及技术产品共同研发和数据资源共享,双方将共同推进直播电商领域的研究和升级,并推出电商直播人工智能解决方案。站长网2023-05-30 14:35:510000京东:将在芒果TV跨年晚会抽7辆特斯拉Model 3十年使用权
今日,京东宣布将在12月31日晚8点独家冠名湖南卫视芒果TV跨年晚会。在此盛大活动中,京东将为大家送上千万份实物好礼和10亿红包。不仅如此,京东汽车还与特斯拉合作,准备了7辆Model3焕新版累计最高10年使用权和10辆特斯拉Cybertruck儿童车等互动大奖。观众只需登录京东APP参与活动,就有机会成为新年第一个锦鲤,获得这些令人心动的奖品。站长网2023-12-26 16:37:040000特斯拉CEO马斯克:比亚迪的产品极具竞争力
日前,有推特网友转发了一段特斯拉CEO马斯克评价比亚迪汽车的视频。视频中,主持人问道:你如何评价比亚迪,马斯克没有直接回答,反而是直接大笑。随后又反问道,你见过比亚迪的车辆吗?我不认为比亚迪有什么好的产品”。对此,马斯克转发视频并评论道,那是很多年前的事了,如今,比亚迪的汽车极具竞争力。站长网2023-05-27 15:34:430000