谷歌推出新的 AI 控制机器人 RT-2 模型:将文本和图像转化为机器人动作
站长之家(ChinaZ.com) 7月31日消息:忘记了那些能画画的人工智能,谷歌最新的人工智能模型能够控制机器人。

上周五,谷歌推出了 Robotics Transformer 2(RT2),这是一个视觉-语言-动作(VLA)模型,可以将文本和图像输出为机器人动作。谷歌表示,RT-2「让我们更接近机器人的未来。」
「就像语言模型通过从网络上的文本进行训练来学习一般的思想和概念一样,RT-2 通过从网络数据中传输知识,以指导机器人行为,」谷歌 DeepMind 的机器人主管 Vincent Vanhoucke 在一篇博文中解释道。「换句话说,RT-2 能够与机器人交流。」
Vanhoucke 表示,虽然聊天机器人可以通过为它们提供有关某个主题的信息来进行训练,但机器人需要更进一步地在真实世界中「扎根」。他提供的例子是一个红苹果。虽然你可以简单地向聊天机器人解释什么是苹果,但机器人需要知道关于苹果的一切,并且还要学会如何将其与类似物品区分开来,比如一个红色的球,并且它们还必须学会如何采摘那个苹果。
RT-2 比谷歌的 RT-1 和其他模型更进一步,因为它使用了来自网络的数据。例如,如果你想让之前的模型丢掉一些东西,你需要对它们进行培训,告诉它们什么是垃圾以及如何使用它。而有了 RT-2,也许你还没有解释过什么是垃圾以及如何使用它,但机器人可以自己通过网络数据弄清楚这一部分。
Robotics Transformer 2 经过了 6000 多次试验,结果证明其功能与其前身 RT-1 一样好。在新颖的、未曾见过的场景中,前者的得分几乎是前者的两倍(62% vs 32%)。
通过 RT-2,机器人能够学习并将所学知识应用于未来的情况。不过,谷歌指出,目前的限制意味着 RT-2 只能帮助机器人在它们已经知道如何执行的物理任务上变得更好,而不能从零开始学习它们。
尽管如此,这是一个巨大的进步,展示了未来可能出现的可能性。想要了解更多信息,谷歌在其 DeepMind 博客中详细介绍了 RT-2 的工作原理。
英伟达发布2024财年第一财季财报 净利润同比增长26%
今日早间,英伟达发布2024财年第一财季财报称,第一财季营收为71.92亿美元,同比下降13%,环比增长19%。净利润为20.43亿美元,同比增长26%。环比增长44%。站长网2023-05-25 10:27:190000月活破亿,字节捧出新“王牌”
经常刷抖音的用户可能有注意到,一个名为“红果短剧”的APP最近的存在感越来越高。作为字节跳动旗下最新月活破亿的APP,红果短剧过去一年的表现不可谓不亮眼:2023年5月,抖音集团首次向市场推出了红果短剧,同年8月,其独立APP正式上线。凭借海量资源免费观看的策略,红果短剧的用户数量迅速增长。到了2023年12月,其日活跃用户已增长至500万,月活跃用户超过了2000万。站长网2025-01-02 16:47:250000Generated——通过AI生成独一无二的模特头像 无版权限制
GeneratedPhotos是一个由人工智能系统生成的图像库,提供各种分类和标记的模特头像照片,可用于增强创意作品。用户可以通过浏览网站或使用API集成来查找和下载图片。官网地址:https://generated.photos/#核心功能:1.独特的模特照片:通过人工智能系统从头开始生成图片,确保图片的独特性。站长网2023-07-24 17:15:230001天猫双11将于10月14日晚8点开启:支持微信支付
天猫平台今日宣布,2024年的天猫双11购物狂欢节将从10月14日晚8点正式拉开序幕。今年的双11将是补贴力度最大、红包数量最多的一届。消费者只需记住四个关键时间点:10月14日晚8点开始支付定金,10月21日晚8点支付尾款,10月31日晚8点启动第二波促销,以及11月10日晚8点进行最后的狂欢冲刺。00001.52万亿!亚马逊创始人贝索斯成为全球首富 马斯克第三
快科技6月13日消息,根据彭博社的亿万富豪指数,当前全球有14位超级富豪的资产总额超过了1000亿美元。截至6月12日的数据显示,杰夫贝索斯以2108亿美元的净资产高居榜首,相当于约1.52万亿元人民币。随着亚马逊股价自今年年初以来上涨23%,公司总市值达到了1.945万亿美元,贝索斯的财富也随之增加了326亿美元。站长网2024-06-14 16:37:380000