谷歌推出新的 AI 控制机器人 RT-2 模型:将文本和图像转化为机器人动作
站长之家(ChinaZ.com) 7月31日消息:忘记了那些能画画的人工智能,谷歌最新的人工智能模型能够控制机器人。
上周五,谷歌推出了 Robotics Transformer 2(RT2),这是一个视觉-语言-动作(VLA)模型,可以将文本和图像输出为机器人动作。谷歌表示,RT-2「让我们更接近机器人的未来。」
「就像语言模型通过从网络上的文本进行训练来学习一般的思想和概念一样,RT-2 通过从网络数据中传输知识,以指导机器人行为,」谷歌 DeepMind 的机器人主管 Vincent Vanhoucke 在一篇博文中解释道。「换句话说,RT-2 能够与机器人交流。」
Vanhoucke 表示,虽然聊天机器人可以通过为它们提供有关某个主题的信息来进行训练,但机器人需要更进一步地在真实世界中「扎根」。他提供的例子是一个红苹果。虽然你可以简单地向聊天机器人解释什么是苹果,但机器人需要知道关于苹果的一切,并且还要学会如何将其与类似物品区分开来,比如一个红色的球,并且它们还必须学会如何采摘那个苹果。
RT-2 比谷歌的 RT-1 和其他模型更进一步,因为它使用了来自网络的数据。例如,如果你想让之前的模型丢掉一些东西,你需要对它们进行培训,告诉它们什么是垃圾以及如何使用它。而有了 RT-2,也许你还没有解释过什么是垃圾以及如何使用它,但机器人可以自己通过网络数据弄清楚这一部分。
Robotics Transformer 2 经过了 6000 多次试验,结果证明其功能与其前身 RT-1 一样好。在新颖的、未曾见过的场景中,前者的得分几乎是前者的两倍(62% vs 32%)。
通过 RT-2,机器人能够学习并将所学知识应用于未来的情况。不过,谷歌指出,目前的限制意味着 RT-2 只能帮助机器人在它们已经知道如何执行的物理任务上变得更好,而不能从零开始学习它们。
尽管如此,这是一个巨大的进步,展示了未来可能出现的可能性。想要了解更多信息,谷歌在其 DeepMind 博客中详细介绍了 RT-2 的工作原理。
Adobe 称印度是其增长最快的市场之一
划重点:-🚀Adobe在印度市场取得了快速增长,助力各行业企业采用数字化解决方案。-💻Adobe计划在印度推出数据中心基础设施,以满足当地数据法规和提高性能。-🎨Adobe致力于负责任地使用生成式AI,保护知识产权并与其他机构合作。AdobeIndia是Adobe公司的第二大部门,如今拥有超过8000名员工,从1997年的单一开发中心发展成为全球企业。站长网2024-05-22 15:13:060000ChatGPT推出iPhone版APP 支持语音输入、跨设备同步记录
今日,美国人工智能公司OpenAI宣布,推出适用于iOS的ChatGPTAPP应用程序。ChatGPTAPP将首发在美国推出,并将在未来几周内扩展到其他国家/地区,安卓版也即将推出。据介绍,ChatGPTAPP可免费使用并跨设备同步历史记录。它还集成了开源语音识别系统Whisper,支持语音输入。此外,ChatGPTPlus订阅者可以独家访问GPT-4的功能。站长网2023-05-19 08:24:340000腾讯二次元社交APP《代号M9》上线:支持虚拟形象等功能
腾讯旗下深圳市网视界科技有限公司推出了一款专为二次元用户打造的全新社交APP——《代号M9-穿越次元遇见你》。这款APP不仅支持虚拟形象装扮、多人群聊、好友地图、实时状态、个性咕卡等新奇功能,还允许用户根据自己的需求对人物进行3D捏脸和更换服装等个性化设置。用户可以通过微信或QQ账号登录该APP,并在上面寻找兴趣相投的朋友,与好友分享实时动态,自由创建兴趣群聊,拥有一个和同好的交流空间。0000中美用户,在直播间里对同一样产品“疯狂上头”
站长网2023-12-28 14:16:020000微信:将打击诱导不知情用户参与身份验证完成账号注册、解封
微信发布针对诱导不知情用户参与身份验证行为的治理公告称,随着微信治理力度不断加强,不法分子可用的微信账号数量越来越少,于是他们将目标转向普通用户,通过诱导不知情用户参与身份验证来完成账号的注册或解封,进而实施骚扰、虚假营销、欺诈等违规行为。为保护用户权益、肃清平台环境,微信团队将继续加强对此类违规行为的打击处理。站长网2024-06-27 14:09:330000