仅靠视觉自主分类物体、能做瑜伽,特斯拉人形机器人再进化
也许未来,真如《终结者》等科幻电影那样,人形机器人将与真人无异。
沉寂了几个月的特斯拉人形机器人擎天柱(Optimus)终于有了新的动态。记得上一次看到它还是在特斯拉股东大会上,当时 Optimus 展示了自由行走、灵活抓取放下物体等技能。

今天,特斯拉 Optimus 又进化了。现在,它可以自主地对物体进行分类了。其中的亮点是神经网络完全端到端训练:输入视频,输出控制。这类似于特斯拉自动驾驶 FSD V12开发中的神经网络训练 —— 处理所有输入信号,输出驾驶决策。

不禁要问,如何做到的呢?
Optimus 拥有了自我校准手臂和腿部的能力,仅使用视觉和关节位置编码器,它就可以在空间中精准定位自己的肢体。

精确的校准能力使 Optimus 更高效地学习各种任务,并且仅使用视觉,其神经网络完全实现了 on-board 运行。
这样一来,Optimus 可以完全自主地将物体按颜色进行分类。


即便有人干扰,Optimus 也能按颜色将物体准确分类。

Optimus 还展示了自主纠正(将歪倒的物体摆正)的行为能力。

经过训练后,它还能执行新任务,比如将分类好的物体打乱。

经过了一整天的「工作」,是时候伸展一下、做个双手合十吧。


团队资深软件工程师 Julian Ibarz 表示,「非常高兴分享团队在过去几个月中取得的进展。现在 Optimus 可以完成长期任务,比如完全以任务无关的方式自动对物体进行分类。只需要收集更多数据,则无需更改任何代码就可以训练新的复杂任务。」

马斯克也肯定了这一「进展」。

网友在震惊之余,也提出了一些问题,比如是否可以输入 prompt 让 Optimus 来执行任务?答案是肯定的,视频中使用相同的网络来执行分类或取消分类任务,只需要告诉 Optimus 你想做什么就行了。

Optimus 的「前世今生」
Optimus 并非一开始就是一个实体机器人的,它从「Tesla Bot」这样一个机器人通用计划慢慢孵化。

2021年马斯克在「特斯拉 AI 日」上展示了 Tesla Bot 的大致形态。
甚至在 Tesla Bot 动作展示时,是由工作人员穿着特制的紧身服装,扮成机器人的模样表演了一段舞蹈。但就是这样一个想法,逐渐扎根,并走向现实,一次次突破给人们惊喜。
一年后的「特斯拉 AI 日」上,曾经由人扮演的 Tesla Bot 变为了机器人 Optimus。

2022年「特斯拉 AI 日」上 Optimus 和人们打招呼
刚亮相的 Optimus 已经可以搬运箱子,给花浇水,在工厂里工作。但这不是 Optimus 的最终目标。Optimus 要成为拥有「大脑」的类人机器人。

Optimus 在特斯拉超级工厂里工作
马斯克表示,当时这个机器人设计出来只用了半年时间,未来成型的样子有很多值得期待的地方。
事实也正如此,2023年特斯拉股东大会上的 Optimus 的脚步已经更加顺畅,动作也更加熟练。

Optimus 灵活抓取、放下物体
而现在,Optimus 已经向着它的目标不断前进,拥有「大脑」的路程也越走越清晰。下一次它将如何进化,我们拭目以待。
参考链接:
https://techau.com.au/tesla-shows-off-teslabot-running-fsd-v12-autonomously-sorting-objects-using-video-in-controls-out/
小鹏汽车推出限时优惠:2023款小鹏G6全系车型降价2万元
小鹏汽车近日宣布,自即日起购买2023款小鹏G6全系任意一款车型,并在2月底之前完成提车的用户,将享受2万元的现金优惠。此次优惠活动使得纯电中型SUV小鹏G6的起售价降至18.99万元。据了解,小鹏G6共有5款配置车型在售,官方指导价为20.99万-27.69万元。此前,小鹏G6曾推出过限时减免1万元的活动,起售价降至19.99万元。而此次优惠力度更大,将起售价进一步降低至18.99万元。站长网2024-02-04 16:06:360000国产Sora来了!清华发布视频生成大模型“视界一粟YiSu”
快科技6月12日消息,据媒体报道,北京极佳视界科技有限公司联合清华大学自动化系正式发布我国首个超长时长、高性价比的Sora级视频生成大模型视界一粟YiSu”。该大模型拥有模型原生的16秒超长时长,并可生成至1分钟以上视频。据介绍,YiSu模型成本更低、速度更快、端侧可用。年初Sora的爆火,让DiT架构受到了业内极大的关注,很多公司和项目也开始复现DiT路线。0001国外是如何整治AI孙燕姿的?
似乎就是一瞬间的事,“冷门歌手”孙燕姿,在B站火了。但这并不是一次“失踪歌手”恰逢其时地回归,也并非两代人隔着十余年的时光,突然有了相同的青春共鸣。聚集在一起的人群,更多以“整活”的心态,围观着AI孙燕姿,这一次称不上复出的“复出”。0000OpenAI COO 谈论 ChatGPT 的发布和公司的发展:AI 技术不会迅速改变企业运营
站长之家(ChinaZ.com)12月5日消息:在2022年11月OpenAI发布ChatGPT前的几周,这家备受瞩目的人工智能公司的执行团队专门用了一次会议来讨论一个问题:他们是否应该发布这个工具?站长网2023-12-05 09:15:450001苹果Vision Pro竟然是乔布斯的遗作?
大家都知道VisionPro历经多年研发,但很少有人知道,乔布斯在世时就对这样的设备有过构思。甚至VisionPro相关专利,最早可以追溯到2007年与初代iPhone同年。跨越17年,VisionPro承载了苹果对未来产品的愿景,也让人对乔布斯和苹果的远思惊叹。19年的乔布斯预言19年前的2005年,乔布斯曾在D3的采访中设想过一种新产品。站长网2024-02-06 14:03:240000