马斯克擎天柱大将跳槽,在抱抱脸开源一套机器人技术:会做家务的大白,复刻低至1800
马斯克部下跳槽,把人形机器人技术开源了。不少创业公司的估值,一夜被打了骨折。
最新成果已正式发布——
它能像大白(●—●)一样,听懂并正确执行人类发出的指令,比如放杯子、拿水果。
可以自己打开笔帽,在白板上写名字。
或者是叠衣服。
把钥匙准确插进锁眼。
这些操作,全都是机器人自己搞定。没有人远程操控,完全端到端实现。
最关键的是,它使用的算法、数据集完全开源!
这意味着,你完全可以在家自己改造一个小机器人,让它完成同样的事。
如上进展,来自Hugging Face今年新成立的机器人项目Le Robot。
团队领军人物Remi Cadene(雷米·卡德内),1月才从特斯拉Optimus机器人团队离职,才过了几个月就带来如上新成果。
这立马引发业内关注,谷歌DeepMind科学家都来围观表示:
开源哆啦A梦才是出路嘛。
网友们更是amazing刷屏了。
所以,这个开源机器人,究竟如何而来?
训练只用2个小时
完成这些动作的,是花粉机器人公司最新的机器人Reachy2。
不过,Reachy2并不是一开始就实现自主操作的,而是先经历了一段遥控操作的过程。
该阶段中,开发人员会佩戴VR装备,控制机器人完成一系列任务。
VR遥控的过程被记录成了50段视频,每段约15秒,与Reachy2机器人内的不同传感器相关联。
这些视频成为了ML算法的学习素材,用于研究如何自行完成并指导Reachy2完成一系列任务。
训练一共持续了2个小时,之后作者测试了所有的checkpoint,发现机器人果然学习到了新的概念——
在2万步时,它学会了将杯子可靠地放在碗碟架上;
在4万步时,它学会了旋转底座并交出苹果;
在6万步时,它学会了旋转手臂回到初始位置。
这其中的数据集和使用的模型,现在都已开源,就连VR操作时用的程序,也同样是开源的。
在抱抱脸上,Reachy训练用的50段视频都可以直接下载,开源框架和工具也放在了GitHub。
包括机器人ML框架LeRobot,采用了Apache-2.0协议,可免费商用,据作者称达到了SOTA水准,在GitHub上已经斩获了3.4k 星标。
LeRobot基于PyTorch实现,包括了预训练模型、人工采集的数据集,还有一套模拟环境,无需真实的机器人硬件也能观察效果。
值得一提的是,斯坦福知名开源机器人项目ALOHA中的数据,也被囊括进了其中。
此外,Reachy2机器人还用到了华人软件工程师、开源AI解决方案平台1ms.ai创始人Haixuan Xavier Tao开源的面向数据流的机器人应用DORA。
除了用DORA帮助HuggingFace完善机器人框架,1ms.ai还曾帮助清华大学完成了一套机器人工程的教程。
说回DORA,它提供了低延迟、可组合和分布式数据流功能,可以简化机器人程序的创建,目前已获1.2k星标。
DORA的目标是将硬件、算法和人工智能模型结合在一起,并使它们相互通信,让硬件和软件的集成变得容易。
DORA提供了Python、Rust、C/C 等多种语言版本,其中在Python上速度比ROS2快了17倍。
在Python上,DORA还具备热重载功能,意味着可以在运行过程中也可以随时修改Python代码。
未来,如果把检索增强生成(RAG)技术和热重载功能结合,还能创建出自编码机器人,根据提示自动生成代码。
作者表示,有了LeRobot和Dora,自己在家也能复刻出一个Reachy2的小号仿品。
把具身智能成本打下来
那么,这个机器人价格到底多少呢?这还是大家最关注的问题。
其实主要取决于硬件。
作者雷米表示,目前能接入LeRobot最便宜的机械臂,只需250美元(折合人民币约1800元)。
目前展示的这款Reachy2,价格还没公布,参考它的上一代,起售价为9750美元(折合人民币约7万元)。
有网友表示,看来几年内把机器人助手价格打到5000美元以内有希望了(大约3.6万,不到一辆车的价格)。
这也是为啥Hugging Face入局具身智能会引发轰动的关键所在。
要知道,具身智能研发成本一直居高不下,这个火爆赛道如今已经吸金几十亿。
而将所有算法数据集开源,意味着人形机器人的成本(起码在软件算法层面)大幅降低,会给业内其他布局机器人领域的玩家带来不小压力。
与此同时,Hugging Face还挖来了一流工程师。
领衔项目的Remi Cadene(雷米·卡德内)曾是特斯拉Autopoilot和Optimus机器人研究项目的成员。
入职时雷米还调侃了OpenAI,表示要做真正意义上的开源。
具体动作上,雷米的脚步走得也确实很快。上个月刚刚发布了Le Robot开源代码库,如今首个具身智能成果也来了。
不过能快速在人形机器人上部署训练,也少不了花粉机器人公司出力。
这是一家来自法国的机器人公司,他们也强调开源理念。在2013年发布了据称是第一个开源的3D打印机器人。
此前已经推出了开源全遥控机器人Reachy1。
雷米介绍,在Hugging Face团队正留意人形机器人硬件时,花粉机器人这边也在找端到端方案,所以两家一拍即合。
而且还有地理上的优势,他们的办公地点相隔只有2小时的路程。
所以我们只是去拜访了他们几天而已。
从目前雷米透露的动向来看,他们还会开源一系列工作,比如语音命令控制等,大家可以期待一下。
By the way,Hugging Face最近正在招人哦,岗位是Post-Sales Machine Learning Solutions Engineer - Asia Remote,感兴趣的童鞋可以尝试下~
中国电信公布 TeleChat 大模型
在2023全球数字经济大会人工智能高峰论坛上,中国电信集团数字智能科技分公司副总经理张鑫公布中国电信版ChatGPT产品TeleChat大模型。据介绍,该模型支持输出代码、写演讲稿等,其公司研发目标是打造万级AI算法舱,以成为百亿级AI服务商,产品涵盖AI算法、平台、应用、硬件、大模型等。站长网2023-07-03 18:15:120000GameGPT:一种全自动游戏开发的多代理方法
要点:GameGPT是一个提出的多智能体方法,旨在自动化游戏开发中的核心任务,以应对日益复杂的游戏开发挑战。当代AAA游戏制作变得资源密集,需要数百人的团队、数百万行代码和巨额预算,而GameGPT旨在利用AI来简化和自动化这个过程。GameGPT采用多智能体框架,每个智能体负责不同的任务,如规划、编程和测试,它们共同合作,将游戏构想转化为成品,以提高效率和降低开发成本。站长网2023-10-16 09:46:4500003个月累计交付7872台 小鹏X9问鼎中国纯电MPV销冠
快科技4月3日消息,小鹏汽车官方今日宣布,小鹏X9三个月累计交付7872台,问鼎中国纯电MPV销冠。据悉,小鹏X9售价区间为35.98万-41.98万元,于今年1月13日开始交付。小鹏X9基于扶摇架构打造,拥有前后一体式铝压铸底盘、全域800V高压平台、XNGP核心技术,同时,该车还是全球唯一标配后轮转向的MPV。站长网2024-04-08 12:41:390000斗鱼发布 2024 年 Q1 财报:营收达 10.4 亿元
斗鱼今日公布了其2024年第一季度的未经审计财务报告,据财报数据显示,斗鱼在2024年第一季度实现了10.4亿元人民币的总营收,同比下降29.9%。其中广告及其他业务的收入为2.39亿元,这一数字占到了总营收的23%,显示出广告业务对斗鱼整体营收的重要贡献,并且这一比例还有所上升。然而,尽管营收表现稳定,斗鱼在本季度仍然录得了8800万元的净亏损,经过调整后的净亏损为8570万元。站长网2024-06-06 00:03:170000盲人辅助神器!微软Seeing AI正式登陆安卓平台 支持18种语言
**划重点:**1.📲微软SeeingAI应用现已在安卓平台上线,可帮助识别人物、货币、文本、条形码,并描述用户面前的场景。2.🔄应用更新包括文本识别、文档识别、条形码阅读、环境描述等功能,以及对安卓平台的特定优化。3.🌍应用支持18种语言,计划在2024年扩展到36种语言,旨在为全球30亿活跃安卓用户提供更多便利。站长网2023-12-06 10:52:010000