谷歌DeepMind推出RT-2 使机器人更智能
谷歌的DeepMind宣布了机器人变换器2(RT-2),这是一种首创的视觉-语言-行为(VLA)模型,可以使机器人在没有特定训练的情况下执行新的任务。
就像语言模型如何从网络规模的数据中学习一般的想法和概念一样,RT-2使用网络上的文本和图像来理解不同的现实世界概念,并将这些知识转化为机器人行为的通用指令。
当这项技术得到改进时,它可以导致具有上下文感知、适应性强的机器人,它们可以根据不同的情况和环境执行不同的任务——而且所需的训练比目前要少得多。
早在2022年,DeepMind就推出了RT-1,这是一个多任务模型,它在13万个演示上进行了训练,并使日常机器人能够以97%的成功率执行700多个任务。现在,使用RT-1的机器人演示数据和网络数据集,该公司已经训练了该模型的后继者:RT-2。
RT-2最大的亮点是,与RT-1和其他模型不同,它不需要数十万个数据点来让机器人工作。组织长期以来发现特定的机器人训练(涵盖每一个对象、环境和情况)对于在高度可变的环境中处理复杂、抽象的任务至关重要。
然而,在这种情况下,RT-2从少量的机器人数据中学习,以执行基础模型中看到的复杂推理,并将所获得的知识转移用于指导机器人行为——即使是它从未见过或被训练过的任务。
“RT-2显示出了改善的泛化能力和超越它所接触到的机器人数据的语义和视觉理解,”谷歌解释说。“这包括解释新的命令并通过执行初级推理来响应用户命令,比如关于对象类别或高级描述的推理。”
谷歌DeepMind的机器人负责人文森特·范霍克(Vincent Vanhoucke)举例说,以前训练一个机器人扔掉垃圾意味着明确地训练机器人识别垃圾,以及捡起垃圾并扔掉它。
但是对于RT-2来说,由于它是在网络数据上进行训练的,所以不需要这样做。该模型已经有了什么是垃圾的一般概念,并且可以在没有明确训练的情况下识别它。它甚至有了如何扔掉垃圾的想法,尽管它从未被训练过采取这样的行动。
当处理内部测试中看到的任务时,RT-2表现得和RT-1一样好。然而,对于新颖、看不见的场景,它的表现几乎提高了一倍,从RT-1的32%提高到62%。
当进步时,像RT-2这样的视觉-语言-行为模型可以导致具有上下文感知能力的机器人,它们可以根据手头的情况在现实世界中执行各种各样的行为,并进行推理、解决问题和解释信息。
例如,企业可以看到的不是在仓库中执行相同重复动作的机器人,而是可以根据对象的类型、重量、易碎性和其他因素以不同的方式处理每个对象的机器人。
根据Markets and Markets的数据,AI驱动的机器人领域预计将从2021年的69亿美元增长到2026年的353亿美元,预期的复合年增长率为38.6%。
词典网站Dictionary.com添加了一系列与 AI 相关的词汇 包括:LLM、GPT等
文章概要:1.Dictionary.com最近扩充了其词汇,将生成式人工智能、GPT和LLM等与人工智能相关的词汇加入其单词列表。2.除了增加词汇外,Dictionary.com还扩展了“幻觉”的定义,该定义涉及产生虚假信息并将其呈现为真实信息,与生成式人工智能有关。3.此外,该词典还计划在秋季增加大量新条目和定义,以跟上不断演化的英语语言。站长网2023-09-07 16:22:380000网友希望迪士尼暴雨天退票 官方回应:售出不退 可游玩室内项目
据报道,上海近日接连几天暴雨,迪士尼多项室外项目停运,影响游玩体验,多名网友发帖建议迪士尼如遇暴雨天能否考虑退还门票费用。对此,迪士尼客服回应称,门票售出后无法退票,如果室外项目没有开放,室内项目还有很多可以游玩。如果消费者购买的是常规预定门票,提前3天可以改期。年卡用户如因天气原因想要免责取消预约,可提供相应官方证明的天气预警的截图,联系微信尝试申请。站长网2023-06-21 15:13:150000苹果提高折抵换购价格 iPhone13ProMax最高可抵5500元
近日,苹果在其官网对AppleTrade-In换购计划进行了更新,提高了折抵换购的价值,适用于iPhone、iPad等产品。根据官方公布的信息,现在购买iPhone13ProMax的用户可享受高达5500元的折抵优惠,而iPhone13Pro的最高折抵金额为4900元。相较于之前的计划,这次调整使得用户可以获得更大的经济回报。站长网2023-07-06 16:49:000001除夕快乐!跟兔年说再见:微信“迎新春”限时状态上线
快科技2月9日消息,今天是除夕”(大年三十),也是兔年最后一天,祝大家除夕快乐。与其他节日一样,微信今天上线了春节限时状态迎新春”。状态设置后24小时内有效,由于是节日限定,该状态只能在春节期间设定,大家可在微信我”的界面点击状态”选择该状态。值得一提的是,如果在微信搜索栏中搜索春节”,结果页右侧也能选择迎新春”状态,并且自带背景图,红色背景配上中国龙和祥云,年味十足,很喜庆。站长网2024-02-09 13:08:110000基于Llama 2的日语LLM发布,参数量达70亿、可与GPT3.5匹敌
文章概要:1.ELYZA发布了基于Meta的Llama2的日语LLM「ELYZA-japanese-Llama-2-7b」,参数数量达到70亿,性能媲美GPT3.5。2.该模型经过追加事前学习和独特的事后学习,性能在5级手动评估中获得最高分,尽管还未达到封闭型LLM的水平,但已经与GPT3.5相匹敌。站长网2023-09-11 15:27:510000