研究人员推新AI框架CyberDemo:通过视觉观察让机器人模仿学习
划重点:
- 🤖 CyberDemo 是一个新颖的框架,利用模拟人类示范来进行现实世界的机器人操纵任务。
- 📊 与传统方法相比,CyberDemo 在各种操作任务中表现出更高的成功率,尤其在处理未见过的物体时表现突出。
- 🌐 CyberDemo 的方法挑战了人们对解决实际问题必须依赖真实示范数据的信念,展示了模拟数据的潜力。
加利福尼亚大学圣地亚哥分校(UCSD)和南加利福尼亚大学(USC)的研究人员最近推出了一种名为 CyberDemo 的新型人工智能框架,旨在通过视觉观察进行机器人模仿学习。
传统的模仿学习方法通常需要大量高质量的示范数据来教导机器人完成复杂任务,特别是对于需要高度灵巧的任务来说。然而,CyberDemo 通过利用模拟人类示范来完成真实世界的机器人操纵任务,从而减少了对物理硬件的需求,使得远程和并行数据收集成为可能。此外,通过模拟器专属的数据增强技术,CyberDemo 显著增强了任务性能,生成的数据集比在真实世界环境中收集的数据集大得多。
CyberDemo 的方法从在模拟环境中使用低成本设备进行远程操作收集人类示范开始。随后,通过广泛的增强方法对数据进行丰富处理,包括各种视觉和物理条件,以提高训练策略对真实世界变化的鲁棒性。该框架采用课程学习策略进行策略训练,首先使用增强数据集,然后逐渐引入真实世界示范以对策略进行微调。与使用真实世界示范数据微调的预训练策略相比,这种方法确保了平稳的从模拟到现实的过渡,解决了光照、物体几何和初始姿势变化等问题,而无需额外的示范。
在各种操纵任务中,CyberDemo 的性能令人印象深刻。相比传统方法,CyberDemo 在任务成功率上取得了显著提高。尤其值得注意的是,在涉及未见过的物体时,CyberDemo 的泛化能力特别突出,在旋转新物体的成功率达到42.5%,这是传统方法表现的显著飞跃。对比基线包括先进的视觉预训练模型如 PVR、MVP 和 R3M,CyberDemo 的成功之处突显了其效率和稳健性,以及其能够胜过在真实世界示范数据集上微调的模型。
CyberDemo 的创新方法通过利用增强的模拟数据挑战了解决实际问题必须依赖真实示范数据的传统观念。通过 CyberDemo 的性能所展示的经验数据,突显了通过数据增强增强的模拟数据在机器人操纵任务的价值方面能够超越真实世界数据。虽然为每个任务设计模拟环境需要额外的工作,但减少了数据收集的人为干预,并避免了复杂的奖励设计过程,为机器人操纵领域带来了一种可扩展且高效的解决方案。
论文地址https://arxiv.org/abs/2402.14795
项目地址:https://top.aibase.com/tool/cyberdemo
美国太空部队因数据安全风险暂停使用 ChatGPT 等人工智能工具
根据路透社看到的一份备忘录,出于数据安全考虑,美国太空部队已暂停其员工使用ChatGPT等基于网络的生成人工智能工具。备忘录日期为9月29日,面向太空部队的工作人员,禁止人员在政府计算机上使用此类人工智能工具,包括大型语言模型,直到他们获得部队首席技术和创新办公室的正式批准。站长网2023-10-13 10:35:370000OpenAI 宣布推出 ChatGPT 漏洞赏金计划 但不接受越狱行为
风靡一时的聊天机器人ChatGPT背后的公司OpenAI周二宣布,它将向报告其人工智能系统漏洞的用户提供最多20000美元资金。OpenAI表示:「我们的奖励范围从200美元的低严重性发现到高达20000美元的特殊发现,」。该计划是通过Bugcrowd这个漏洞赏金平台进行的。站长网2023-04-12 14:40:100000站在中国服饰主战场,他们这样做出万亿大生意
深秋已至,中国北方的很多城市已飘下了今年的第一场雪。南方人也已经裹上了厚外套,迎接寒潮的到来。剁手党们已按捺不住,研究起秋冬装囤货攻略,将毛衣、羽绒、貂皮大衣、保暖睡衣等加入购物车,要在双11把今年的“必囤好物”买个够。每年的双11,都是人们囤秋装、冬装的最佳时节。面对爆棚的囤货需求,服饰商家也早早就开始了备货,准备在双11大干一场。0000苹果被曝内部测试AI产品Ajax 盘中市值一度几秒暴增600亿美元
苹果的股票在周三短暂上涨,原因是彭博新闻报道称,该公司正在内部开发自己的人工智能大语言模型。这一举动表明,苹果对人工智能技术的最新进展非常重视,并考虑将其集成到未来的产品中。该公司很少使用“人工智能”这个术语,而是选择更学术的“机器学习”。在过去的一年里,技术人员和投资者都对大语言模型(LLM)这种人工智能技术着迷,它可以生成看起来像人类写的文本或代码。站长网2023-07-20 10:10:110000GPT-4 API免费用??OpenAI:律师函警告,快删了
最近什么GitHub项目最火?GPT4FREE绝对是其中之一。毕竟,顾名思义,免费使用GPT-4的API,就问谁!不!心!动!这不,上线没多久,已揽下18.5k??不说,还分分钟被正主OpenAI找上门,要求麻溜儿下架,否则就起诉。项目来自一名ID为xtekky的逆向工程师。具体来说,这位童鞋是搞了这么一套操作:站长网2023-05-02 09:53:110000