RoboTool:让机器人通过大语言模型创新性地运用工具
**划重点:**
1. 🧠 研究人员在卡内基梅隆大学和Google DeepMind开发了RoboTool,这是一个系统,通过利用大型语言模型,扩展了机器人的能力,使它们能够更创造性地使用工具。
2. 🌐 RoboTool通过接受自然语言指令,使用GPT-4模型生成可执行代码,帮助机器人以更灵活和创意的方式解决各种复杂任务,如举重或按压难以到达的按钮。
3. 🏡 该系统不仅有望推动机器人在家庭任务中的应用,还能在领域中发挥创新作用,例如构建步石以攀爬到目标位置,或在灾后环境中适应性地利用工具。
研究人员在卡内基梅隆大学和Google DeepMind最近开发了名为RoboTool的系统,该系统通过利用大型语言模型,为机器人创造性地使用工具提供了可能性。该系统的引入有望为机器人领域带来新的创新和创造力浪潮。
"工具的使用经常被视为先进智能的标志,"卡内基梅隆大学博士候选人兼论文的共同第一作者Mengdi Xu介绍道。他补充说:"创意地使用工具不仅要求预测动作结果的全面能力,还需要推理使用哪种工具以及如何使用它们。"
机器人通常以标准和重复的方式完成手动任务,而不去探索替代方法。然而,通过更创新的方式解决问题,它们可以更好地应对复杂的现实场景。Mengdi Xu的同事之一、共同第一作者和博士候选人Peide Huang表示:"在机器人领域,创意工具使用也是一种关键但非常苛刻的能力,因为它需要全方位地预测行动结果、推理使用哪种工具以及规划如何使用它们。"
研究人员的主要目标是设计一个允许机器人更创造性地使用工具的系统。这种工具可以帮助机器人更有效地解决各种现实问题,例如在试图抓取无法触及的物体时,或者创建攀爬到目标位置的步石时,能够调整其策略。
Peide Huang解释说:"大型语言模型(LLMs)的崛起极大地增强了聊天机器人、编码自动化和视觉内容创建等功能。在这些数字界面之外,具有实体存在的AI可能代表着智能的下一个领域,即与现实世界进行有形互动。机器人作为LLMs的物理延伸,为这一探索提供了理想的媒介。"
过去的研究已经展示了LLMs在改善各种机器人功能方面的潜力,包括与用户的交流、推理、规划和任务执行。例如,Google DeepMind的SayCan工具使机器人能够理解诸如"I spilled my drink, can you help?"这样的自然语言指令,并随后制定策略来解决各种家务问题。然而,利用LLMs解决机器人身体和周围环境设定的隐含约束的问题仍然具有挑战性。
Peide Huang、Mengdi Xu及其同事决定探索LLMs的使用,以提高机器人在不同任务中的创造性。换句话说,他们希望创建一个系统,能够识别使看似"不可能"的任务成为可能的创意方法。
他们提出的系统名为RoboTool,接受关于环境、机器人结构和要遵循的任何约束的自然语言指令,然后生成应用机器人参数化低级技能以控制模拟和实体机器人的代码。
研究人员创建的新工具具有四个关键组件:分析器、规划器、计算器和编码器。分析器处理用户用自然语言给出的提示,识别可能影响所请求任务可行性的关键元素。
RoboTool的规划器组件接收原始语言输入和已识别的关键概念,利用它们制定完成任务的综合策略。计算器组件则确定参数,例如每个参数化技能所需的目标位置。
RoboTool的最终组件,即编码器,将规划器创建的综合计划和计算器产生的参数转换为可执行代码。值得注意的是,所有这些组件都是使用OpenAI的GPT-4模型开发的。
RoboTool使机器人能够创造性地使用工具,解决各种以前未遇到的复杂任务。例如,它可以帮助制造杠杆以举起重箱,或使用磁性方块制作杆以按下难以触及的按钮。
Peide Huang、Mengdi Xu及其合作者开发的这一新工具很快就能够被全球的机器人学家使用,以拓展其系统的能力。该工具可以使机器人执行更复杂的家务任务,例如使用可用工具清理排水管或修理破损的家具。
Mengdi Xu说:"RoboTool还可以通过即兴使用可用工具来改善机器人在碎片或倒塌的结构中导航,以达到被困人员。它还可以应用于建筑和维护,允许机器人使用手头上的任何工具适应性地修复机械设备或结构,或通过创造性地组合传统工具构建精细设计。"
研究人员已经在项目网站上发布了RoboTool的演示视频。在他们的下一项研究中,他们计划将大型视觉基础模型纳入其系统,包括支持3D计算机视觉的模型,因为这可以进一步增强机器人在开放环境中的感知和推理能力。卡内基梅隆大学的副教授、CMU Safe AI实验室主任丁昭表示:"我们还计划开发人类与RoboTool进行直观指导和协作的方式,并为RoboTool建立安全措施,以降低机器人与人类共同工作时的风险。"
小米14Ultra已进入试产阶段 即将开始量产
近日,数码闲聊站透露,小米14Ultra已经进入了试产阶段,并且即将开始量产。这款手机预计最快将在2月底正式发布,届时将与小米平板7系列一同亮相,并与小米汽车SU7实现跨端协同。作为小米的旗舰级产品,小米14Ultra无疑拥有强大的影像能力。与小米14Pro相比,其最大的变化在于配备了1英寸超大底主摄和5倍潜望长焦镜头。这种配置有望为用户带来更出色的拍摄体验。站长网2024-01-25 16:44:130000阿里发布夸克扫描王APP 搭载AI大模型技术
阿里智能信息事业群发布了夸克扫描王APP,这是一款手机扫描产品,搭载了AI大模型技术。夸克扫描王APP可以高效地解决文件整理问题,无论是在工作、学习还是生活中,它都可以帮助你扫描文件、提取资料、拍摄证件照、进行文件格式转换和智能消除不需要的内容。站长网2023-08-29 14:22:450000字节跳动旗下时光相册延期至 12 月 6 日停运
字节跳动旗下的时光相册发布公告,宣布将延长应用关停时间至2023年12月6日。这是由于仍有一些用户未完成照片和视频的下载。公告提醒用户,关停时间仅为一次延期调整,之后将不再变动。站长网2023-11-20 08:45:360002雷军:小米SU7定位C级高性能生态科技轿车 是承载大家向往的梦想之车
快科技12月27日消息,小米官方已经确认,小米汽车技术发布会将于12月28日本周四下午2点开始。针对本次发布会,雷军近日对诸多网友的问题进行了解答。雷军表示,这次发布更多的会讲技术,不发产品。小米造车,从开始就坚持从底层核心技术出发。在近日播出的央视新闻《面对面》访谈中,雷军透露,小米造车的投入是其他汽车制造商的十倍。站长网2023-12-27 20:04:510000手机开始卷24GB内存 理想汽车的车机早实现了
快科技8月16日消息,最近手机市场迎来一波24GB内存热潮,包括RedmiK60至尊版、一加Ace2Pro,本月还有realmeGT5。不过24GB内存的实现,车机居然领先了。据了解,理想汽车L9Max/Pro、理想L8Max、理想L7Max的车机早就配备了24GB内存了。除L9Pro外,其他Pro车型配备的是12GB内存。站长网2023-08-16 20:50:260000