大翻车!斯坦福超火机器人自曝内幕,研究者救场还受伤了,网友:放心了
爆火的斯坦福全能家务机器人Mobile ALOHA,大!翻!!车!!!
你以为它擦个红酒轻而易举,但实际上却是这样的:
全给你弄撒喽,顺带碎个杯子……
你以为它能化身大厨娴熟烹炒,结果给你上演一个炒锅底:
Mobile ALOHA的翻车大合集还不止这些。
例如刚才炒完虾的锅,哎呦喂,一不小心没拿住:
即使小哥一个箭步冲上去也没阻止“悲剧”的发生(好像还烫到手了)。
这画面,真是像极了庄嫂摔碗……昨天还在“神坛”上的Mobile ALOHA,一夜之间便被曝出了这么多“笨手笨脚”的样子,也是引来不少网友的围观。
然而,这次即使面对翻车铁证,网友们的画风却是一反常态:
它并不完美,不过很可爱。
总会有犯错的余地。
最重要的是:
放心了。(手动狗头)
这到底是怎么回事?
斯坦福团队自曝“丑闻”
原来,这段机器人大翻车的视频,就是由斯坦福Mobile ALOHA的作者Tony Z. Zhao发布的。
并且他还直言不讳地说道:
机器人还没有做好准备接管这个世界。
而这段翻车视频,正是机器人完全在自主模式下所犯的。
用作者的话来形容,就是“最愚蠢的错误”。
毕竟除了刚才我们展示的几个例子之外,Mobile ALOHA甚至连锅都放不进橱柜里:
炒完的虾粘锅倒不出来不说,连碗的位置也找不到:
拿支笔也没法找对位置下手:
面对失败合集,作者却是打趣道:
面对失败合集,作者却是打趣道:
这是我目前为止最喜欢的视频了,(不过)当机器人在你面前犯错的时候,你就不会觉得那么有趣了。
确实,毕竟手都被烫了……
不过作者今天自曝这段视频其实应该还有另外一个原因。
因为前两天Mobile ALOHA神级现场的视频确实引来了不小的关注度,不过很多人误以为这是它在自主模式下完成的。
但其实,Mobile ALOHA采用的是混合模式,并非完全自主,作者也呼吁网友们在吃瓜的同时认真看下论文和代码。
值得一提的是,作者还引用了2015年波士顿动力Atlas人形机器人“翻车合集”并向它致敬。
或许这也正如英伟达科学家Jim Fan说的那样:
一步一个脚印。
学习50次,成功率能到90%
就在这两天,Mobile ALOHA团队连续放出三个爆火视频,展示了该机器人敏捷灵巧的家务能力,看呆网友。
包括做满汉全席(磕鸡蛋、给鸡肉翻面这种细活都信手拈来):
包括做满汉全席(磕鸡蛋、给鸡肉翻面这种细活都信手拈来):
套枕套铺床单:
浇花、拖地板、开瓶盖,甚至逗猫猫:
那叫一个人模人样,上得厅堂下得厨房。
不过,大部分都是真人操控的,比如上面这些。
更直观的可以看下面这个抽纸擦玻璃的动图,背后直接站了个人类1:1示范:
不过,对于一些相对简单的任务,例如这个单炒虾仁:
还有刷锅、将餐椅归位、呼叫并乘坐电梯、擦桌子等等,只需真人少量示教,它就可以学会,然后脱离人类进行自主操作。
具体而言,作者介绍,上面这些简单动作目前只需要学习50次就可以做到90%的成功率——
经测试,Mobile ALOHA可以连续9次擦干倒洒了的酒、连续呼叫5次电梯都不会出错,能够保持一定的稳定性。
除此之外,它还能抗干扰,在完成归置锅具到柜子之中时,实验人员不停向它面前投掷杂物,都完全没有影响它发挥:
在训练期间根本看不见的椅子?它也能准确识别并完成归位任务。
那么,作者是如何仅通过50个演示就让Mobile ALOHA实现自主任务的呢?
最关键的是通过ACT或扩散策略进行模仿学习,然后和静态操作数据一起对机器人系统进行联合训练。
有了这一联合训练方式,机器人的性能可以显著提高,尤其是那种需要精确操作的任务。
最后,也再次为介绍一遍斯坦福大学的这个机器人成果:
它于今年3月底正式发布,历经了8个月的迭代和2个月的测试。
一共三位作者,其中两位为斯坦福计算机科学专业的华人博士生(最后一位是导师):
当时的这位机器人,就已经能够利用工具完成各种精密细活了,只不过只能在固定的位置:
当然,背后也是真人遥控的。
而正如其名ALOHA全称是“𝐀 𝐋ow-cost 𝐎pen-source 𝐇𝐀rdware System”,这款机器人主打的就是开源和低成本:
全部软硬件设计包括代码和数据都一并发布,而搭建这一个系统“只”需3.2万美元(约合22.7万人民币),具体需要哪些硬件,作者还列了个清单,感兴趣的朋友可以照着DIY。
机器人元年?
几乎和斯坦福的爆火机器人同一时间,谷歌也发布了自家最新的研究成果,并且是一气发了仨:
一个是将机器人决策速度提高14%,同时保持操作准确率不变并增加了10.6%的改进模型;
一个是专攻泛化能力的新框架,用了一种全新方法让机器人完成从未见过任务的成功率从29%提升至63%;
以及一个可以同时容纳20个机器人的收据收集系统,将用于加快机器人理解人类指令的能力的训练。
这些新成果全部用于升级谷歌的机器人大模型RT-2。
和斯坦福的Mobile ALOHA对比起来,谷歌的RT-2表现还是高冷一些,但它所有效果都是全自主的。
除了这两家,李飞飞团队也一直在跟进,其名为VoxPoser的机器人系统也已经可以听懂人话完成各种指令,并且无需额外训练。
这不由地让人想到,不少人那句“2024会是机器人元年”的预言:
你觉得会成真吗?
你觉得会成真吗?
参考链接:
https://twitter.com/tonyzzhao/status/1743378437174366715
拼多多的双11,“简单粗暴”
今年你是双11“尾款人”吗?经历了比价、满减凑单和10多天的等待后,你的双11购物快感还在吗?不少人已经厌倦了。“比价半天,买亏了”“比价真的累,能不能都显示一口价,别搞优惠券和凑单了”“能不能学pdd直接降价”……确实有很多人,近年来选择逃离繁琐的大促规则,拥抱简单直接降价的拼多多。站长网2023-11-03 17:01:030000618前夜,小红书全面开放“笔记带货”
“小红书终于开始认真做转化了。”有小红书服务商感叹道。继成立新的直播部门,布局董洁等头部大主播直播间,大力发展直播带货业务后,小红书电商又开启了“带货”新姿势——“笔记带货”。有商家告诉亿邦动力,在全新的“笔记带货”功能中,品牌终于可以以纯佣金形式与达人进行合作,不再只有广告一种合作模式。站长网2023-05-16 14:09:030001AI性能旗舰魅族21 Note曝光!对标友商K70和Ace3
快科技4月23日消息,不久前魅族有一款型号为M468Q”的新机通过了3C认证,此前有消息称该机为魅族21X,不过根据最新消息,该手机预计为魅族21Note。数码博主数码闲聊站”今天透露,魅族备案新品不是网传的21X,市场名称预计叫魅族21Note,定位AI性能旗舰,在游戏和性能体验上完全对标友商(Redmi)K70和(一加)Ace3。站长网2024-04-23 15:12:430000“抢不到”的五月天门票
“55、56、57、58、59”,坐在工位上的思思非常紧张,她一边盯着电脑屏幕,瞪大眼睛看时间一秒秒过去,一边攥紧手机,不断刷新抢票界面,只为了抢到五月天乐团的演唱会门票。5月9日11点和17点,分别是五月天“好好好想见到你”场和“诺亚方舟10周年进化复刻限定版”场的开票时间,这是疫情放开后,他们在内地举办的首场演唱会,尽管会在北京鸟巢连开6场,但门票还是供不应求。站长网2023-05-11 15:22:560001国内真无对手!比亚迪7月狂卖262161辆:能打十个新势力
快科技8月1日消息,比亚迪公布了其7月份销量,7月新能源汽车共交付262161辆,上年同期销量162530辆,同比增加61.3%;而比亚迪今年销量已累计达1517798辆,同比增长87.63%。据悉,比亚迪今年加大的海外业务布局,随着销售店的陆续建成,其海外销量也在逐步增加,比亚迪7月海外销售新能源车已达18169辆。站长网2023-08-01 19:53:490000