Meta联手CMU打造通用机器人智能体——RoboAgent
站长网2023-08-21 21:53:430阅
Meta 和 CMU 联合研究团队耗时两年,成功开发出了一款名为 RoboAgent 的通用机器人智能体。RoboAgent 仅仅通过7500个轨迹的训练就实现了12种不同的复杂技能,包括烘焙、拾取物品、上茶、清洁厨房等任务,并能在100种未知场景中泛化应用。

论文地址:https://robopen.github.io/media/roboagent.pdf
无论遇到多大的干扰,RoboAgent 都能坚持完成任务。该研究的目标是建立一个高效的机器人学习范例,解决数据集和场景多样性的挑战。研究人员提出了多任务动作分块 Transformer(MT-ACT)架构,通过语义增强和高效的策略表示来处理多模态多任务机器人数据集。

研究人员还开发了 RoboSet 数据集,其中包含7500条轨迹,涵盖12种不同的技能和多个任务和场景。通过离线添加不同变化的场景来增加数据集,并使用动作分块 Transformer 模型来处理多任务数据。实验结果显示,MT-ACT 策略在通用性和样本效率上表现出色,优于其他基线模型。这项研究对于推动通用机器人智能体的发展具有重要意义。
0000
评论列表
共(0)条相关推荐
Spiritme AI:手机拍5分钟视频即可克隆一个虚拟的你
SpiritmeAI是一个类似Heygen的工具,可以帮助你克隆虚拟形象。使用iPhone拍摄一段大约5分钟的视频,即可捕捉你的外貌、动作和可能的表情,然后克隆一个虚拟的你!最令人印象深刻的是,它还可以将PPT、PDF文件直接转换成解说视频,只需两次点击操作即可。体验地址:https://top.aibase.com/tool/spiritme-ai主要功能:站长网2023-12-29 13:20:280000在线购物“虚拟试穿”模型Diffuse to Choose(DTC) 可将任何商品完美放入任何环境中
DiffusetoChoose(DTC)是一种新型的虚拟试穿技术,它允许用户将任何商品放入任何环境中,实现逼真的在线购物体验。这一模型能够更好地捕捉商品的细节,并提升修复质量,同时保证产品在不同环境中看起来自然和真实。项目地址:https://top.aibase.com/tool/diffuse-to-choose站长网2024-01-29 14:36:170000微软画图或将引入AI画图功能,支持文本转图像
据WindowsCentral报道,微软可能会在Windows11上的微软画图中引入基于AI的新功能,其中包括支持用户通过文本描述生成图片的能力。消息人士告诉WindowsCentral,AI功能将由Bing的ImageCreator背后的相同技术提供支持,该工具可以根据您的描述生成图像。您可以在WindowsCentral发布的内部模型中看到集成的外观。站长网2023-08-23 12:45:320000Instagram 推出定制AI贴纸和滤镜 功能强化创作者体验
Instagram近日推出一系列新功能,进一步优化创作者在平台上的体验。最引人瞩目的就是支持用户利用AI技术为故事和短视频制作定制贴纸的新功能。图片来源:Instagram通过Meta自主研发的图像分割AI模型,用户可以选择图片中的任意物体生成贴纸。操作过程与苹果iOS16中推出的图像剪切功能类似,用户可以手动调整剪切范围。制作完成后,定制贴纸可以在发布内容时使用。站长网2023-11-16 11:32:450000硅谷“鲁迅”开喷!AI大佬LeCun狂怼马斯克、OpenAI
硅谷正经历着一场由人工智能引发的激烈辩论。引领这一风潮的不是别人,正是机器学习之父、图灵奖得主、Meta首席人工智能科学家YannLeCun。LeCun以其直言不讳的风格,在AI领域掀起了一场舌战风暴,从马斯克到OpenAI,全都被他毫不客气地“怼”了一遍。站长网2024-05-29 18:00:370000