马斯克擎天柱大将跳槽,在抱抱脸开源一套机器人技术:会做家务的大白,复刻低至1800
马斯克部下跳槽,把人形机器人技术开源了。不少创业公司的估值,一夜被打了骨折。
最新成果已正式发布——
它能像大白(●—●)一样,听懂并正确执行人类发出的指令,比如放杯子、拿水果。

可以自己打开笔帽,在白板上写名字。
或者是叠衣服。

把钥匙准确插进锁眼。

这些操作,全都是机器人自己搞定。没有人远程操控,完全端到端实现。
最关键的是,它使用的算法、数据集完全开源!
这意味着,你完全可以在家自己改造一个小机器人,让它完成同样的事。

如上进展,来自Hugging Face今年新成立的机器人项目Le Robot。
团队领军人物Remi Cadene(雷米·卡德内),1月才从特斯拉Optimus机器人团队离职,才过了几个月就带来如上新成果。
这立马引发业内关注,谷歌DeepMind科学家都来围观表示:
开源哆啦A梦才是出路嘛。

网友们更是amazing刷屏了。

所以,这个开源机器人,究竟如何而来?
训练只用2个小时
完成这些动作的,是花粉机器人公司最新的机器人Reachy2。
不过,Reachy2并不是一开始就实现自主操作的,而是先经历了一段遥控操作的过程。
该阶段中,开发人员会佩戴VR装备,控制机器人完成一系列任务。
VR遥控的过程被记录成了50段视频,每段约15秒,与Reachy2机器人内的不同传感器相关联。
这些视频成为了ML算法的学习素材,用于研究如何自行完成并指导Reachy2完成一系列任务。
训练一共持续了2个小时,之后作者测试了所有的checkpoint,发现机器人果然学习到了新的概念——
在2万步时,它学会了将杯子可靠地放在碗碟架上;
在4万步时,它学会了旋转底座并交出苹果;
在6万步时,它学会了旋转手臂回到初始位置。

这其中的数据集和使用的模型,现在都已开源,就连VR操作时用的程序,也同样是开源的。
在抱抱脸上,Reachy训练用的50段视频都可以直接下载,开源框架和工具也放在了GitHub。
包括机器人ML框架LeRobot,采用了Apache-2.0协议,可免费商用,据作者称达到了SOTA水准,在GitHub上已经斩获了3.4k 星标。

LeRobot基于PyTorch实现,包括了预训练模型、人工采集的数据集,还有一套模拟环境,无需真实的机器人硬件也能观察效果。
值得一提的是,斯坦福知名开源机器人项目ALOHA中的数据,也被囊括进了其中。

此外,Reachy2机器人还用到了华人软件工程师、开源AI解决方案平台1ms.ai创始人Haixuan Xavier Tao开源的面向数据流的机器人应用DORA。
除了用DORA帮助HuggingFace完善机器人框架,1ms.ai还曾帮助清华大学完成了一套机器人工程的教程。
说回DORA,它提供了低延迟、可组合和分布式数据流功能,可以简化机器人程序的创建,目前已获1.2k星标。

DORA的目标是将硬件、算法和人工智能模型结合在一起,并使它们相互通信,让硬件和软件的集成变得容易。
DORA提供了Python、Rust、C/C 等多种语言版本,其中在Python上速度比ROS2快了17倍。

在Python上,DORA还具备热重载功能,意味着可以在运行过程中也可以随时修改Python代码。
未来,如果把检索增强生成(RAG)技术和热重载功能结合,还能创建出自编码机器人,根据提示自动生成代码。
作者表示,有了LeRobot和Dora,自己在家也能复刻出一个Reachy2的小号仿品。
把具身智能成本打下来
那么,这个机器人价格到底多少呢?这还是大家最关注的问题。

其实主要取决于硬件。
作者雷米表示,目前能接入LeRobot最便宜的机械臂,只需250美元(折合人民币约1800元)。

目前展示的这款Reachy2,价格还没公布,参考它的上一代,起售价为9750美元(折合人民币约7万元)。
有网友表示,看来几年内把机器人助手价格打到5000美元以内有希望了(大约3.6万,不到一辆车的价格)。

这也是为啥Hugging Face入局具身智能会引发轰动的关键所在。
要知道,具身智能研发成本一直居高不下,这个火爆赛道如今已经吸金几十亿。

而将所有算法数据集开源,意味着人形机器人的成本(起码在软件算法层面)大幅降低,会给业内其他布局机器人领域的玩家带来不小压力。
与此同时,Hugging Face还挖来了一流工程师。
领衔项目的Remi Cadene(雷米·卡德内)曾是特斯拉Autopoilot和Optimus机器人研究项目的成员。
入职时雷米还调侃了OpenAI,表示要做真正意义上的开源。

具体动作上,雷米的脚步走得也确实很快。上个月刚刚发布了Le Robot开源代码库,如今首个具身智能成果也来了。
不过能快速在人形机器人上部署训练,也少不了花粉机器人公司出力。
这是一家来自法国的机器人公司,他们也强调开源理念。在2013年发布了据称是第一个开源的3D打印机器人。
此前已经推出了开源全遥控机器人Reachy1。
雷米介绍,在Hugging Face团队正留意人形机器人硬件时,花粉机器人这边也在找端到端方案,所以两家一拍即合。
而且还有地理上的优势,他们的办公地点相隔只有2小时的路程。
所以我们只是去拜访了他们几天而已。
从目前雷米透露的动向来看,他们还会开源一系列工作,比如语音命令控制等,大家可以期待一下。

By the way,Hugging Face最近正在招人哦,岗位是Post-Sales Machine Learning Solutions Engineer - Asia Remote,感兴趣的童鞋可以尝试下~

人工智能写作助手Flot.ai:使用最新GPT-4 模型 支持200多种语言
Flot.ai是一款人工智能写作助手,能够帮助用户在任何应用或网站上获得AI的帮助,无需复制粘贴就可以使用ChatGPT。Flot.ai使用OpenAI最新的GPT-4模型,支持200多种语言,真正做到一键使用AI。体验地址:https://flot.ai/站长网2023-09-11 18:01:100000人形机器人将进宝马工厂「实习」 之前它还只会冲咖啡
前段时间,名为“Figure01”的机器人因会冲咖啡而走红。这两天,它还找到了新工作,要去宝马的美国工厂“实习”,干得好的话,一两年后就能到流水线上参与“造车”了。站长网2024-01-23 09:34:540001腾讯视频将上线“无障碍剧场” 视障人士可观看600余部经典影视作品
12月3日,腾讯视频与中国盲文出版社、中国盲文图书馆联合宣布,腾讯视频将于2024年初上线“无障碍剧场”专区,分批次上线600余部热门经典影视作品的无障碍版本。腾讯视频计划在“无障碍剧场”分批上线的600余部影视无障碍作品,兼顾不同年龄段的视障用户观影喜好,既有《我的1919》这样的经典主旋律影片,又有《大江大河》《奔腾岁月》等经典电视剧、《夏洛特烦恼》等口碑喜剧。站长网2023-12-04 14:38:420001一个UP主,让15年前的游戏再次伟大
6月1日,B站UP主「潜艇伟伟迷」发了一个视频,标题是「感谢大家对植物大战僵尸杂交版的支持!」。截止到今天我们这篇内容发布,5天时间,播放量超过900万,是「潜艇伟伟迷」目前播放量最高的一条视频。目前,「潜艇伟伟迷」在B站有接近250万粉丝,这250万的粉丝当中,根据飞瓜的数据监测,近30天的涨粉数量是167万。站长网2024-06-06 21:01:230000GPT-5不会真正突破,24年AGI不会实现!全网AI大佬24年最全预测
【新智元导读】经过23年的生成式AI之年,24年AI会有哪些新突破?大佬预测,即使GPT-5发布,LLM在本质上仍然有限,在24年,基本的AGI也不足以实现。23年是当之无愧的「生成式AI之年」。24年,AI技术会有哪些突破?英伟达高级科学家JimFan称,2024年将是视频年。尽管机器人和具身智能体才刚刚起步,但我认为视频AI将在未来12个月内迎来突破性进展的时刻。0000