机器人又拿下一种家务:10小时学会煮咖啡,仅需观看人类演示视频
上周斯坦福炒虾机器人炸场之后,又火了一个煮咖啡机器人。
它的厉害之处在于通过观看人类的示范视频,仅需10小时端到端训练,就能学会并完全自主搞定这一任务。
当然,更准确地来说是操作咖啡机:
只见它打开机盖、放入咖啡包,再按下开始按钮,整个过程一气呵成,无需任何远程遥控。
很快,一杯咖啡就可以端走享用:
注意了,以上演示视频,没有任何加速处理。这就是该机器人目前可以达到的实际操作速度。
而除了这些,它还具备自主纠错功能:
如果咖啡包没有放正,不用人类提醒,它自己就能调整好。
对此,前谷歌DeepMind研究员(也是该机器人的开发人员)直接就是一个转发点赞,并再次强调:
所有行为包括纠错,完全自主。
公司创始人Brettt Adcock称,这就是机器人技术的ChatGPT时刻。
不管是不是每个人都赞同这个说法,但网友被它的训练速度所折服是没得说。
10个小时真的很优秀,快进到使用研磨机和法压壶,估计很快视频里个咖啡机也要失业了。(手动狗头)
所以,这个机器人具体什么来头?
10小时端到端训练搞定煮咖啡
如上这个机器人来自一家商业公司,名叫Figure。
Figure总部位于美国,成立于2022年,专攻通用人形机器人。
创始人Brett Adcock毕业于美国佛罗里达大学,26岁时创办了一家在线人才市场网站,后被同行1.1亿美元收购,然后又创办了一家生产全电动垂直起降飞机的航天公司,作家27亿美元上市。
如今,这家机器人公司Figure也可谓吸金无数,先是在去年5月拿到7000万美元A轮融资,两个月后又获得英特尔900万美元投资。
去年10月——大概成立一年之际,Figure发布首款人形机器人,代号Figure01。
它走起路来是这样的:
我们今天看到的煮咖啡演示则正是由它完成。
而学会这项技能,只花了它10个小时的训练时间——
Figure01采用的是端到端神经网络,这边接收人类煮咖啡的视频,那边就能输出动作轨迹,让机器人通过模仿,最终完成自主操作。
以此类推,让它学会别的任务,也只需要输入相应的视频即可。
至于具体实现细节,官方没有透露。
不过,抛去10小时就完成训练不谈,对于让机器人学会煮咖啡这类任务本身来说,已经不是一件难事儿了。
其核心就是模仿学习,入选CoRL’22(机器人,学习会议)的VIOLA可以做到(它是一个以对象为中心的模仿学习框架,基于Transformer进行推理,擅长长程任务,比最先进的模仿学习算法性能高出45.8%);
来自谷歌、今年6月发布的HYDRA,也专攻于此,擅长各种粗粒度和细粒度控制,并可自如切换。
来自斯坦福大学的AME,基于路点(Waypoint)实现,对于煮咖啡这种任务也毫不含糊,只不过速度慢很多。
还有英伟达的HITL-TAMP、MimicGen等研究成果,也就是机器人模仿学习相关,就不一一介绍了。
2040年前,谁能成功挑战史蒂夫咖啡测试?
尽管Figure01的表现很不错(比如速度就很快),但不少网友还是评价:
这和想象中的煮咖啡机器人还有一点距离。
比如它能不能拿起杯子、将其放到咖啡机下,沏完之后再添加奶油和糖,再将杯子放到托盘上,端到人面前?
事实上,苹果公司联合创始人Steve Wozniak曾提出一个评估机器人自主能力的咖啡测试。
它要求机器人从进入一个陌生的家中开始,然后找到厨房,识别工具(例如咖啡机、水壶)和材料(咖啡豆、糖、牛奶等),最终做好一杯咖啡,且全程不超过20分钟。
这个测试考验机器人在未知环境中导航、识别物体、操作工具和材料以及遵循人类命令等一系列能力。
有人发起过投票,问2040年之前能否有这样的机器人诞生?
结果有89%的人投了yes。
你认为有希望吗?
参考链接:
[1]https://twitter.com/Figure_robot/status/1743985067989352827
[2]https://twitter.com/Figure_robot
[3]https://manifold.markets/MatthewBarnett/will-a-robot-be-created-that-is-cap
天猫超市联合菜鸟开通北京半日达服务
今天上午,天猫超市与菜鸟集团宣布启动“半日达”服务,让北京市民享受上午购物、下午收货的便捷体验。据了解,天猫超市半日达服务在半年内已在北京等20个城市开通,双11期间多座城市也可享受半日达服务。在半日达城市内,消费者只需打开手机淘宝进入天猫超市,选择带有醒目半日达标识的商品并下单,商品就会在承诺时间内送达。站长网2023-10-12 14:12:550000哈利波特AI时装秀走红 小红书博主圈粉7.8万
小红书博主“油画里的德拉科”以哈利波特四大学院的不同特点和品质为灵感,利用AI生成了四大学院学长的时装秀。通过代表各学院精神的院训,展示了拉文克劳、斯莱特林、格兰芬多和赫奇帕奇四大学院的特色。拉文克劳秀场的赞藏数据最高,达1.2万,斯莱特林秀场次之。模特们用冷峻的表情、凌厉的面部线条和优越的身材展现了时装周高定秀场的精髓。该博主还将这四组图以图片轮播的形式同步发布至抖音,总获赞数超过7万。站长网2023-09-06 17:35:590000未来最火的六大行业:人工智能技术和应用,你准备好了吗?
#什么行业是即将要火起来的行业#可能会在未来火爆的6大行业:1.人工智能技术和应用:随着人工智能技术的不断发展,越来越多的企业开始将其应用于产品和服务中,从而提高效率和降低成本。2.新能源和可再生能源:随着环保意识的不断提高,新能源和可再生能源的需求也越来越大,这将是未来的一个重要发展方向。站长网2023-05-23 12:05:240001Meta CEO 扎克伯格希望通过数字助手、智能眼镜和人工智能来帮助推动元宇宙
站长之家(ChinaZ.com)9月28日消息:Meta推出了新的人工智能工具和名人代言的数字助手,CEO马克·扎克伯格希望这些工具可以帮助启动元宇宙。在加利福尼亚州门洛帕克总部举行的MetaConnectVR开发者大会上,扎克伯格展示了AI软件、公司新款Quest3虚拟现实头戴设备以及最新款Ray-Ban智能眼镜。站长网2023-09-28 09:08:030002Devin第一手使用体验:完成度很高,开始编码就停不下来,但要替代程序员还很远
【新智元导读】Devin到底是一个漂亮的Demo,还是一个已经能替代程序员的智能体,使用体验怎么,拿到测试资格的网友第一时间分享了自己的体验。由10枚IOI金牌在手的创业团队CognitionAI开发的全球首个AI程序员智能体Devin,一发布就让科技圈坐立不安。在演示中,Devin几乎已经可以独立完成很多人类程序员需要大量时间才能完成的工作,效果一点不比普通程序员差。站长网2024-03-16 20:13:040001