仅靠视觉自主分类物体、能做瑜伽,特斯拉人形机器人再进化
也许未来,真如《终结者》等科幻电影那样,人形机器人将与真人无异。
沉寂了几个月的特斯拉人形机器人擎天柱(Optimus)终于有了新的动态。记得上一次看到它还是在特斯拉股东大会上,当时 Optimus 展示了自由行走、灵活抓取放下物体等技能。
今天,特斯拉 Optimus 又进化了。现在,它可以自主地对物体进行分类了。其中的亮点是神经网络完全端到端训练:输入视频,输出控制。这类似于特斯拉自动驾驶 FSD V12开发中的神经网络训练 —— 处理所有输入信号,输出驾驶决策。
不禁要问,如何做到的呢?
Optimus 拥有了自我校准手臂和腿部的能力,仅使用视觉和关节位置编码器,它就可以在空间中精准定位自己的肢体。
精确的校准能力使 Optimus 更高效地学习各种任务,并且仅使用视觉,其神经网络完全实现了 on-board 运行。
这样一来,Optimus 可以完全自主地将物体按颜色进行分类。
即便有人干扰,Optimus 也能按颜色将物体准确分类。
Optimus 还展示了自主纠正(将歪倒的物体摆正)的行为能力。
经过训练后,它还能执行新任务,比如将分类好的物体打乱。
经过了一整天的「工作」,是时候伸展一下、做个双手合十吧。
团队资深软件工程师 Julian Ibarz 表示,「非常高兴分享团队在过去几个月中取得的进展。现在 Optimus 可以完成长期任务,比如完全以任务无关的方式自动对物体进行分类。只需要收集更多数据,则无需更改任何代码就可以训练新的复杂任务。」
马斯克也肯定了这一「进展」。
网友在震惊之余,也提出了一些问题,比如是否可以输入 prompt 让 Optimus 来执行任务?答案是肯定的,视频中使用相同的网络来执行分类或取消分类任务,只需要告诉 Optimus 你想做什么就行了。
Optimus 的「前世今生」
Optimus 并非一开始就是一个实体机器人的,它从「Tesla Bot」这样一个机器人通用计划慢慢孵化。
2021年马斯克在「特斯拉 AI 日」上展示了 Tesla Bot 的大致形态。
甚至在 Tesla Bot 动作展示时,是由工作人员穿着特制的紧身服装,扮成机器人的模样表演了一段舞蹈。但就是这样一个想法,逐渐扎根,并走向现实,一次次突破给人们惊喜。
一年后的「特斯拉 AI 日」上,曾经由人扮演的 Tesla Bot 变为了机器人 Optimus。
2022年「特斯拉 AI 日」上 Optimus 和人们打招呼
刚亮相的 Optimus 已经可以搬运箱子,给花浇水,在工厂里工作。但这不是 Optimus 的最终目标。Optimus 要成为拥有「大脑」的类人机器人。
Optimus 在特斯拉超级工厂里工作
马斯克表示,当时这个机器人设计出来只用了半年时间,未来成型的样子有很多值得期待的地方。
事实也正如此,2023年特斯拉股东大会上的 Optimus 的脚步已经更加顺畅,动作也更加熟练。
Optimus 灵活抓取、放下物体
而现在,Optimus 已经向着它的目标不断前进,拥有「大脑」的路程也越走越清晰。下一次它将如何进化,我们拭目以待。
参考链接:
https://techau.com.au/tesla-shows-off-teslabot-running-fsd-v12-autonomously-sorting-objects-using-video-in-controls-out/
马斯克正式「切脑」,Neuralink内部实验室照片曝光!7年计划22000例手术,全力研发只为对抗超级AI
最近,马斯克传记作者写了一篇Neuralink最新进展的长文。从明年开始,Neuralink将开始为人类植入脑机接口。2024年计划进行11台植入手术,而到2030年,这个数字要增长2000倍,计划为超过22000人植入脑机接口。作者在过去的三年里,曾10次前往Neuralink位于硅谷的工厂及其在奥斯汀的实验室访谈和参观,见证了Neuralink业务的不断发展。站长网2023-11-14 11:58:190000消息称天猫精灵智能眼镜正测试大模型交互
据财联社消息,阿里巴巴天猫精灵的一款智能眼镜正在测试升级大模型交互系统。该音频眼镜能够实现随时智能语音交互,为用户提供即时的运动指导和饮食建议,在游戏过程中亦可陪聊角色攻略,如同一名AIGC助手。5月9日,天猫精灵旗下一款智能眼镜正式开售,售价为899元。该智能眼镜采用极简设计,整机重量仅27g,并提供了百搭黑框和商务钛金两种边框选择。站长网2023-05-19 17:48:520000天玑!联发科天玑9400参数尘埃落定:vivo全球首发
快科技9月12日消息,博主数码闲聊站曝光了天玑9400的详细配置,这是联发科迄今最强悍的手机芯片。据悉,天玑9400延续了上一代的全大核架构方案,由1颗3.63GHzCortex-X925超大核3颗2.8GHzCortex-X4超大核4颗2.1GHzCortex-A7系列大核组成。站长网2024-09-13 17:31:2900006.4万有机会回本了:搭载FSD的特斯拉很快就能自己“跑出去赚钱”
快科技6月14日消息,特斯拉今早更新微博,其中提到:搭载FSD的特斯拉很快就能自己跑出去赚钱”。在今早举办的2024特斯拉股东大会上,特斯拉CEO埃隆马斯克提到特斯拉Robotaxi即将到来。此前马斯克曾宣布,特斯拉将于8月8日发布全自动驾驶”的无人驾驶出租车Robotaxi。这项服务将允许用户通过手机应用程序预订车辆,并可指定乘车人数,操作方式类似于现有的网约车服务。站长网2024-06-14 23:50:580001YaRN:可高效扩展现有大模型的上下文窗口长度
要点:1、YaRN是一种计算高效的方法,可以扩展基于transformer的语言模型的上下文窗口,与以前的方法相比,它需要10倍更少的token和2.5倍更少的训练步骤。2、YaRN利用了旋转位置嵌入(RoPE)来增强模型处理顺序数据和获取位置信息的能力,同时通过压缩变压器来扩展上下文窗口。站长网2023-09-08 14:36:160001