谷歌DeepMind推出RT-2 使机器人更智能
谷歌的DeepMind宣布了机器人变换器2(RT-2),这是一种首创的视觉-语言-行为(VLA)模型,可以使机器人在没有特定训练的情况下执行新的任务。

就像语言模型如何从网络规模的数据中学习一般的想法和概念一样,RT-2使用网络上的文本和图像来理解不同的现实世界概念,并将这些知识转化为机器人行为的通用指令。
当这项技术得到改进时,它可以导致具有上下文感知、适应性强的机器人,它们可以根据不同的情况和环境执行不同的任务——而且所需的训练比目前要少得多。
早在2022年,DeepMind就推出了RT-1,这是一个多任务模型,它在13万个演示上进行了训练,并使日常机器人能够以97%的成功率执行700多个任务。现在,使用RT-1的机器人演示数据和网络数据集,该公司已经训练了该模型的后继者:RT-2。
RT-2最大的亮点是,与RT-1和其他模型不同,它不需要数十万个数据点来让机器人工作。组织长期以来发现特定的机器人训练(涵盖每一个对象、环境和情况)对于在高度可变的环境中处理复杂、抽象的任务至关重要。
然而,在这种情况下,RT-2从少量的机器人数据中学习,以执行基础模型中看到的复杂推理,并将所获得的知识转移用于指导机器人行为——即使是它从未见过或被训练过的任务。
“RT-2显示出了改善的泛化能力和超越它所接触到的机器人数据的语义和视觉理解,”谷歌解释说。“这包括解释新的命令并通过执行初级推理来响应用户命令,比如关于对象类别或高级描述的推理。”
谷歌DeepMind的机器人负责人文森特·范霍克(Vincent Vanhoucke)举例说,以前训练一个机器人扔掉垃圾意味着明确地训练机器人识别垃圾,以及捡起垃圾并扔掉它。
但是对于RT-2来说,由于它是在网络数据上进行训练的,所以不需要这样做。该模型已经有了什么是垃圾的一般概念,并且可以在没有明确训练的情况下识别它。它甚至有了如何扔掉垃圾的想法,尽管它从未被训练过采取这样的行动。
当处理内部测试中看到的任务时,RT-2表现得和RT-1一样好。然而,对于新颖、看不见的场景,它的表现几乎提高了一倍,从RT-1的32%提高到62%。
当进步时,像RT-2这样的视觉-语言-行为模型可以导致具有上下文感知能力的机器人,它们可以根据手头的情况在现实世界中执行各种各样的行为,并进行推理、解决问题和解释信息。
例如,企业可以看到的不是在仓库中执行相同重复动作的机器人,而是可以根据对象的类型、重量、易碎性和其他因素以不同的方式处理每个对象的机器人。
根据Markets and Markets的数据,AI驱动的机器人领域预计将从2021年的69亿美元增长到2026年的353亿美元,预期的复合年增长率为38.6%。
谷歌希望开发者承诺不会滥用新的 Chrome 广告 API
据国外媒体报道,谷歌计划推出适用于Chrome的新API,旨在为网络浏览器提供根据用户偏好定制的广告。然而,由于指纹识别攻击可能导致个人身份被识别的问题曝光后,谷歌已要求开发人员不要滥用该方法。站长网2023-06-30 19:36:060000Meta投资人工智能推动视频推荐 融合Feed和Reels
Facebook母公司Meta正大力投资人工智能技术,作为其"到2026年的技术路线图"的一部分,旨在开发全新的人工智能推荐模型为其所有视频产品做推荐,包括类似TikTok的Reels短视频服务和FacebookFeed中的传统长视频。站长网2024-03-07 14:50:230000AIGC撒下的种子,开出了不同香气的花
“不知道妙鸭都不懂最近的朋友圈了。”最近,一款名为“妙鸭相机”的AI相机小程序在朋友圈走红,引发了一轮朋友圈“个人写真”的分享热潮。这是一款基于AI人脸识别的AIGC应用,用户花费9.9元上传多张个人照片后就可以获得一个专属的数字分身,生成一套系统模板下的“个人写真”。然而面对上传21张清晰正面照片的操作,许多用户也表示了担忧。能否上传他人照片、照片是否会有其他用处等争议相继出现。站长网2023-08-09 20:03:260000AI可以识别香气了 利用神经网络让你“看见”气味
要点:利用图神经网络建立了分子结构与气味描述之间的首个映射该模型可以根据分子的化学结构预测气味描述这可能是实现气味数字化的重要一步,但要落实共享气味等可能性还需更多工作近日,研究人员利用一种称为图神经网络的深度学习算法,建立了一种模型,能够将化合物的结构映射到气味描述。该模型已成功预测人类小组如何描述新的气味,最终实现气味的数字化。这项工作发表在8月31日的《科学》杂志上。站长网2023-09-06 17:45:210000每周AI大事件 | GPT-4全面进入Windows 11、AI诈骗正全国爆发、百度内测基于大模型多款产品
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域热点内容,帮助大家更好地了解人工智能领域的动态和发展风向。注:图片由midjourney生成Part1动态[国内要闻]百度正内测基于大模型技术的“AI伙伴”、“AIBOT”以及NEWAPP等产品站长网2023-05-26 09:44:010001