用Vision Pro实时训练机器狗,MIT博士生开源项目火了
Vision Pro又现火爆新玩法,这回还和具身智能联动了~
就像这样,MIT小哥利用Vision Pro的手部追踪功能,成功实现了对机器狗的实时控制。

不仅开门这样的动作能精准get:

也几乎没什么延时。

Demo一出,不仅网友们大赞鹅妹子嘤,各路具身智能研究人员也嗨了。
比如这位准清华叉院博士生:

还有人大胆预测:这就是我们与下一代机器互动的方式。

项目如何实现,作者小哥朴英孝(Younghyo Park)已经在GitHub上开源。相关App可以直接在Vision Pro的App Store上下载。

用Vision Pro训练机器狗
具体来看看作者小哥开发的App——Tracking Steamer。
顾名思义,这个应用程序旨在利用Vision Pro追踪人类动作,并将这些动作数据实时传输到同一WiFi下的其他机器人设备上。

动作追踪的部分,主要依靠苹果的ARKit库来实现。
其中头部追踪调用的是queryDeviceAnchor。用户可以通过长按数字表冠来重置头部框架到当前位置。
手腕和手指追踪则通过HandTrackingProvider实现。它能够追踪左右手腕相对于地面框架的位置和方向,以及每只手25个手指关节相对于手腕框架的姿态。

网络通信方面,这个App使用gRPC作为网络通信协议来流式传输数据。这使得数据能被更多设备订阅,包括Linux、Mac和Windows设备。
另外,为了方便数据传输,作者小哥还准备了一个Python API,让开发者能够通过编程方式订阅和接收从Vision Pro流式传输的追踪数据。
API返回的数据是字典形式,包含头部、手腕、手指的SE(3)姿态信息,即三维位置和方向。开发者可以直接在Python中处理这些数据,用于对机器人的进一步分析和控制。

就像不少专业人士所指出的那样,别看机器狗的动作还是由人类控制,事实上,相比于“操控”本身,结合模仿学习算法,人类在这个过程中,更像是机器人的教练。
而Vision Pro通过追踪用户的动作,提供了一种直观、简单的交互方式,使得非专业人员也能够为机器人提供精准的训练数据。
作者本人也在论文中写道:
在不久的将来,人们可能会像日常戴眼镜一样佩戴Vision Pro这样的设备,想象一下我们可以从这个过程中收集多少数据!
这是一个充满前景的数据源,机器人可以从中学习到,人类是如何与现实世界交互的。
最后,提醒一下,如果你想上手试一试这个开源项目,那么除了必备一台Vision Pro之外,还需要准备:
苹果开发者账户
Vision Pro开发者配件(Developer Strap,售价299美元)
安装了Xcode的Mac电脑
嗯,看样子还是得先让苹果赚一笔了(doge)。
项目链接:
https://github.com/Improbable-AI/VisionProTeleop?tab=readme-ov-file
参考链接:
https://twitter.com/younghyo_park/status/1766274298422161830
微信规范小程序收集用户手机号行为 违规或限制相关能力
微信公众平台发布了《关于小程序收集用户手机号行为的规范》称,部分开发者在处理用户手机号过程中,存在不规范收集行为,影响了用户的正常使用体验,此类情况涉及收集用户隐私违规。《微信小程序平台运营规范》15.用户隐私和数据规范对此规范如下:站长网2023-08-03 15:52:580004成立一年品牌商单不断,这帮“很癫”的98后创意人如何用AI赚钱?
生成式AI的迅猛发展让我们站在了一个充满可能性的十字路口。每个身处其中的人,都渴望捕捉时代的机遇,成为建造新世界的一员。面对新一轮技术浪潮,率先拥抱变化的先行者们都在做些什么,成了十分值得探讨的命题。这里是“AI新榜”推出的对话栏目「头号AI玩家」,在这里我们与一线AI玩家及公司深度对话,尽力挖掘变革时代下的新故事、新探索和新洞见。站长网2024-12-20 17:54:400000AI攻克机器人验证器:“我不是机器人”按钮已经失守
大部分上网经验丰富的用户,应该对下图的这个图标有着深刻印象:这类按钮,以及各种找到汽车/自行车/红绿灯”的九宫格图片,或是最简单的输入图中数字,它们都属于reCAPTCHA”,机器人验证器。快科技8月16日消息,近日,美国加州大学艾尔文分校一组研究人员发布论文,宣告了此类机器人验证器的失守。站长网2023-08-16 20:30:200000万能AI编程工具包插件Sidekick 提供个性化编程帮助
SidekickAI是一款强大的VisualStudioCode扩展,旨在帮助开发人员更快速、更高效地编写代码、提出问题和发现错误。它由GPT-4引擎提供支持,为开发者提供高效、便捷的编程体验。体验地址:站长网2023-09-26 09:57:010000研究人员警告:用AI生成的内容训练AI,可能会出现“模型崩溃”
随着越来越多的人使用AI来制作和发布内容,一个明显的问题出现了:当AI生成的内容在互联网上激增并且AI模型开始使用AI生成的内容进行训练,会发生什么?来自英国和加拿大的一组研究人员已经研究了这个问题,并且最近在开放获取期刊arXiv上发表了一篇相关论文。他们的发现令当前的生成式AI技术及其未来令人担忧:“我们发现在训练中使用模型生成的内容会导致生成的模型出现不可逆转的缺陷。”站长网2023-06-15 10:10:370001