首页站长资讯谷歌推出新的 AI 控制机器人 RT-2 模型：将文本和图像转化为机器人动作

谷歌推出新的 AI 控制机器人 RT-2 模型：将文本和图像转化为机器人动作

站长网2023-07-31 09:21:080阅

站长之家(ChinaZ.com) 7月31日消息:忘记了那些能画画的人工智能，谷歌最新的人工智能模型能够控制机器人。

上周五，谷歌推出了 Robotics Transformer 2（RT2），这是一个视觉-语言-动作（VLA）模型，可以将文本和图像输出为机器人动作。谷歌表示，RT-2「让我们更接近机器人的未来。」

「就像语言模型通过从网络上的文本进行训练来学习一般的思想和概念一样，RT-2 通过从网络数据中传输知识，以指导机器人行为，」谷歌 DeepMind 的机器人主管 Vincent Vanhoucke 在一篇博文中解释道。「换句话说，RT-2 能够与机器人交流。」

Vanhoucke 表示，虽然聊天机器人可以通过为它们提供有关某个主题的信息来进行训练，但机器人需要更进一步地在真实世界中「扎根」。他提供的例子是一个红苹果。虽然你可以简单地向聊天机器人解释什么是苹果，但机器人需要知道关于苹果的一切，并且还要学会如何将其与类似物品区分开来，比如一个红色的球，并且它们还必须学会如何采摘那个苹果。

RT-2 比谷歌的 RT-1 和其他模型更进一步，因为它使用了来自网络的数据。例如，如果你想让之前的模型丢掉一些东西，你需要对它们进行培训，告诉它们什么是垃圾以及如何使用它。而有了 RT-2，也许你还没有解释过什么是垃圾以及如何使用它，但机器人可以自己通过网络数据弄清楚这一部分。

Robotics Transformer 2 经过了 6000 多次试验，结果证明其功能与其前身 RT-1 一样好。在新颖的、未曾见过的场景中，前者的得分几乎是前者的两倍（62% vs 32%）。

通过 RT-2，机器人能够学习并将所学知识应用于未来的情况。不过，谷歌指出，目前的限制意味着 RT-2 只能帮助机器人在它们已经知道如何执行的物理任务上变得更好，而不能从零开始学习它们。

尽管如此，这是一个巨大的进步，展示了未来可能出现的可能性。想要了解更多信息，谷歌在其 DeepMind 博客中详细介绍了 RT-2 的工作原理。

谷歌推出新的AI 控制机器人RT 2 模型 将文本和图像转化为机器人动作

0000

评论列表

共(0)条

相关推荐

站长资讯
轻松识别Midjourney等AI生成图片，开源GenImage
AIGC时代，人人都可以使用Midjourney、StableDiffusion等AI产品生成高质量图片，其逼真程度肉眼难以区分真假。这种虚假照片有时会对社会产生不良影响，例如，生成公众人物不雅图片用于散播谣言;合成虚假图片用于金融欺诈，造成信任危机等。
站长网2024-01-16 10:08:20
0000
站长资讯
「微李」和解内幕：微念付费获李子柒品牌经营权；放弃网红经纪业务
2021年3月，网红李子柒背后所属MCN公司微念获得字节跳动最新一轮融资，融资完成后微念估值高达50亿元。如果4个月后，李子柒没有停更，没有跟微念彻底决裂并对薄公堂的话，也许现在微念已经完成上市辅导。双方在业内的知名度与影响力亦不可同日而语，李子柒可能成了商业价值最成功的网红，微念也跻身名利双收的上市公司行列。然而，现实商业世界里，没有那么多如果。
站长网2023-05-12 20:24:36
0000
小米澎湃OS 2带来全新HyperCore内核卢伟冰：一触快、一眼新
小米集团总裁卢伟冰近日在社交媒体上分享了小米澎湃OS2的最新进展，强调了其基础体验的全面升级。他指出，澎湃OS2带来了“一触即快”和“一眼即新”的显著变化，这得益于小米在系统底层的重构和统一融合。
站长网站长资讯2024-10-25 11:17:42
0000
站长资讯
十大网文名场面出圈，IP共创如何赋能“好故事”？
“有生之年系列!终于等到第二季开机!”5月10日，“庆余年官微”发布#庆余年第二季今日开机#的消息。彼时，电视剧第一季完结已逾3年，原著小说连载也已超16年。但官宣一出，随即在多个平台引发刷屏效应，其“IP向心力”可见一般。
站长网2023-05-19 17:59:53
0000
站长资讯
ChatGPT预测狗狗币在2024年价格将达到1美元
文章概要:-ChatGPT称投资Dogecoin具有战略意义-ChatGPT预计Dogecoin将在2024年第一季度达到1美元-Dogecoin与马斯克关系依然牢固近日，ambcrypto作者SuzukiShillsalot使用ChatGPT对Dogecoin（狗狗币）未来价格走势的预测。
站长网2023-10-09 11:41:33
0000