机器人也会系鞋带了!斯坦福团队用模仿学习赋予机器人新技能丨已开源
斯坦福年初刚教完机器人炒菜,现在又教机器人系鞋带!
他们还发布了全球首个机器人自主系鞋带演示视频:
与之前的炒菜版1.0相比,这个版本的它可以执行更加轻巧、复杂的任务。
评论区的网友也是一片夸夸:
网友一:小手怪巧的,我系鞋带都没他系的好!
网友二:OMG!是个好东西!量产!
网友三:可爱捏!它甚至会打蝴蝶结!
小手怪巧的
除了系鞋带,视频中的Aloha2机器人还会挂衣服、拧齿轮、收拾厨房,甚至是给“同事”换不同用途的配件。
咱们一起来看一下它的表现~
先是挂衣服。演示视频中,Aloha2先是乖乖的把衣服摆好,然后一气呵成地就把衣服套在了衣架上(它甚至知道抵一下防止衣服掉落)。
数据库中的没有的衣服类型也可以挂。
在拧齿轮的测试中,它的表现也不错。成功地把三个塑料齿轮插进了一个带摩擦力的插座,完美咬合。
“收拾厨房”的环节:Aloha2乖乖地把桌面散落的餐具规整到一起,摆放整齐。
到了给“同事”换配件的时候,也是一气呵成。先摘下旧的,再拿起新的对准后安上!
怎么学会的
为了训练Aloha2机器人,研究团队使用扩散策略进行大规模训练,共在5个任务中收集2.6万个示范数据。
值得一提的是,他们的训练仅仅是基于模仿学习的方法,并不涉及强化学习。
而Aloha2机器人的神经网络架构则是参考了ACT模型,没有用到条件VAE编码器(变分自动编码器)。
他们具体是这么做的:
研究人员给嵌入加了个位置嵌入,然后喂了一个8500万的Transformer编码器,之后用双向注意力进行解码,就得到了观察结果的潜在嵌入。
这些潜在的东西再传给一个5500万参数且带双向注意力的Transformer编码器。
解码器的输入是个50x14的张量,就是一个带位置信息的噪声动作块。这些嵌入跟观察编码器的潜在嵌入和时间步(用独热向量表示)进行交叉注意力。
解码器最后输出一个50x512的维度,然后用线性层映射成50x14,这就是对接下来50个动作的预测噪声。
基础模型总共有2.17亿个可学习的参数。小模型的话,研究人员用1700万的编码器和3700万的解码器,总共1.5亿参数。
训练时,研究人员基于JAX框架,在64个TPUv5e上并行训练,批量大小256,总共进行了200万步的训练。
并且使用带权重衰减的Adam优化器,权重衰减是0.001,线性学习率预热5000步,之后保持恒定速率为1e-4
最终结果如下:
研究人员对最终的结果很满意,发文感叹:
实验的总体成功率很高!模仿学习可能是实现99%成功率的有效途径!
One more thing
Aloha2的研究团队主要由DeepMind和斯坦福研究小组组成。
Aloha2是对原始Aloha系统的增强版本,为了更加支持双手的远程操作。
与之前的版本相比Aloha2在硬件方面进行了多项改进,使其能够执行更复杂和细致的操作任务,
目前研究团队已经开源了Aloha2的所有硬件设计,并提供详细的教程和模拟模型,以便于研究人员和开发者进行大规模的双手操作研究。
论文地址:https://openreview.net/pdf?id=gvdXE7ikHI
项目地址:https://aloha-unleashed.github.io/
百度旗下小度青禾新款手机曝光 支持5G网络
近日,一款型号为XD-SEE000-2302的5G手机通过了国家3C认证,申请人为上海小度技术有限公司。这款新机采用了极具辨识度的后置影像模组设计,十分独特。根据入网信息,这款手机支持5G网络连接,配备UC13CCC充电器,支持5V2A的10W充电。正面外观与上一代产品相似,采用水滴直屏设计。站长网2023-07-14 16:20:390001内容IP,流量生意之外的另一条道路
腾讯视频一开年就出了王炸。作为一部在播出前,全网总预约数超过了800万的绝对大热剧,由赵丽颖、林更新主演的仙偶大剧《与凤行》在3月18日首播,开播146分钟热度破28000,创腾讯视频最快进必看俱乐部剧集纪录。站长网2024-03-20 17:04:300000Gemini Pro 1.5及其百万上下文功能现已向所有人开放
近日,备受期待的GeminiPro1.5以及其百万上下文功能已经向所有用户开放。这一新功能的推出,无疑将为AI领域的应用带来更多可能性。体验地址:https://top.aibase.com/tool/google-ai-studio站长网2024-03-23 05:18:240002余承东:有信心赢得与特斯拉的竞争 华为智驾更胜一筹
2024世界智能网联汽车大会在北京隆重开幕,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东出席了此次盛会,并在会上发表了主题演讲。在谈及特斯拉FSD即将进入中国市场的消息时,余承东表达了华为赢得这场竞争的坚定信心。此前,特斯拉CEO埃隆·马斯克在公司第二季度的财报电话会议上透露,特斯拉计划在欧洲和中国申请监管批准,以在监督下实施FSD(全自动驾驶),并预计在今年年底前获得批准。0000苹果尴尬!iOS系统比安卓难上手实锤了:易用性相差58%
快科技6月23日,Android和iOS谁更易用?恐怕对于不同的人来说,答案会各不相同。不过,Greensmartphones试图借助搜索引擎来统计出一种确定性的答案。方法是汇总过去12个月iPhone和Android上执行一种常见任务如截图、录屏、拉黑、扫码等操作的搜索量,如果搜索量很大,那证明对于用户并不友好,或者说功能并不直观。结果发现,Android的易用性比iOS高出58%。站长网2023-06-23 23:42:490001