谷歌正在以训练人工智能聊天机器人的方式训练机器人
站长网2023-07-29 10:20:330阅
据theverge报道,谷歌希望通过发布人工智能学习模型 Robotic Transformer (RT-2)来使其机器人变得更加智能。
RT-2是该公司所谓的视觉-语言-动作 (VLA) 模型的新版本。该模型教会机器人更好地识别视觉和语言模式,以解释指令并推断哪些物体最适合该请求。
图片:谷歌
研究人员在厨房办公室环境中用机械臂测试了 RT-2,要求其机械臂决定什么是一把好的简易锤子(它是一块石头),并选择一种饮料给疲惫的人(红牛)。他们还告诉机器人将可乐罐移到泰勒·斯威夫特的照片上。这个机器人是 Swiftie,这对人类来说是个好消息。
该公司在一篇论文中表示,新模型基于网络和机器人数据进行训练,利用了谷歌自己的 Bard 等大型语言模型的研究进展,并将其与机器人数据(例如要移动的关节)相结合。它还可以理解英语以外的语言的指示。
多年来,研究人员一直试图让机器人具有更好的推理能力,以解决如何在现实生活环境中生存的问题。The Verge 的詹姆斯·文森特指出,现实生活是极其混乱的。机器人需要更多的指令才能为人类做一些简单的事情。例如,清理溢出的饮料。人类本能地知道该怎么做:拿起玻璃杯,拿一些东西来清理脏乱的东西,然后把它扔掉,下次要小心。
以前,训练机器人需要很长时间。研究人员必须单独制定方向。但借助 RT-2等 VLA 模型的强大功能,机器人可以访问更多信息来推断下一步该做什么。
谷歌去年首次涉足智能机器人领域,当时它宣布将在机器人技术中使用其法学硕士PaLM,创建名称尴尬的PaLM-SayCan系统,以将法学硕士与物理机器人集成。
谷歌的新机器人并不完美。《纽约时报》观看了该机器人的现场演示,并报道称它错误地识别了苏打水的口味,并将水果错误地识别为白色。
0000
评论列表
共(0)条相关推荐
机器人研究迎来ImageNet时刻:一个数据集,让DeepMind具身智能大模型突飞猛进
为什么机器人技术远远落后于NLP、视觉和其他AI领域?除其他困难外,数据短缺是罪魁祸首。谷歌DeepMind联合其他机构推出了OpenX-Embodiment数据集,并训练出了能力更强的RT-X模型。在大模型不断取得突破的2023,把大模型当做大脑来辅助运行的具身智能机器人研究也在被迅速推进。站长网2023-10-05 09:19:070002异军突起的视频AI,揭示了什么?
悄然崛起的视频AI,标志着AI竞争进入了下一阶段。在当下的AI赛道上,AI聊天、绘画一类的应用,早已枝繁叶茂。然而,在此类同质化应用扎堆的情况下,一类颇有技术难度,也较少被人提及的方向,正在悄然崛起。这就是最能调动人感官的视频AI领域。根据twitter上的作者Will郎瀚威统计的图表,今年8—9月,各大文生图类AI网站的访问量均开始呈现下降趋势。站长网2023-10-11 19:11:240000续航400里,新日新款电动车“幻影F9”亮相,颜值出挑,动力强劲
近些年,随着人们对电动车的需求量增大,各大企业研发出的产品也发生了日新月异的变化,不仅在外观上得到了改善,在品质方面也得有了提升。比如我们今天要分析的这款车型,新日新款电动车幻影f9,它的颜值出挑外观大气,有1200瓦强悍的输出动,关键是充满电可以跑出400里的续航,我们它的配置看看究竟如何?这款车型采用了简约的设计手法,引用了用f系车型外观设计灵感,使其更加有线条感。站长网2023-05-24 15:44:580006基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了
这个模型和Sora一样采用了DiT框架。众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了AIGC(人工智能内容生成)社区创新的一大阻碍。同时随着时间的推移,AIGC社区又能获得持续更新的、更高质量的数据集和更先进的算法。站长网2024-03-11 09:07:470001华为nova Flip今日正式开启预约
华为在7月30日宣布,其新一代折叠屏手机——novaFlip,将在今天下午16:08开放预约。尽管官方尚未透露具体价格,但根据市场预测,这款手机的起始售价预计在5000元左右,有望成为华为迄今为止定价最为亲民的折叠屏手机。作为nova系列的一员,该机型旨在吸引年轻消费者,其较低的售价和时尚的设计预计将吸引更多用户尝试折叠屏技术,从而扩大华为在折叠屏市场的份额。站长网2024-07-30 15:31:490000