用Vision Pro实时训练机器狗,MIT博士生开源项目火了
Vision Pro又现火爆新玩法,这回还和具身智能联动了~
就像这样,MIT小哥利用Vision Pro的手部追踪功能,成功实现了对机器狗的实时控制。
不仅开门这样的动作能精准get:
也几乎没什么延时。
Demo一出,不仅网友们大赞鹅妹子嘤,各路具身智能研究人员也嗨了。
比如这位准清华叉院博士生:
还有人大胆预测:这就是我们与下一代机器互动的方式。
项目如何实现,作者小哥朴英孝(Younghyo Park)已经在GitHub上开源。相关App可以直接在Vision Pro的App Store上下载。
用Vision Pro训练机器狗
具体来看看作者小哥开发的App——Tracking Steamer。
顾名思义,这个应用程序旨在利用Vision Pro追踪人类动作,并将这些动作数据实时传输到同一WiFi下的其他机器人设备上。
动作追踪的部分,主要依靠苹果的ARKit库来实现。
其中头部追踪调用的是queryDeviceAnchor。用户可以通过长按数字表冠来重置头部框架到当前位置。
手腕和手指追踪则通过HandTrackingProvider实现。它能够追踪左右手腕相对于地面框架的位置和方向,以及每只手25个手指关节相对于手腕框架的姿态。
网络通信方面,这个App使用gRPC作为网络通信协议来流式传输数据。这使得数据能被更多设备订阅,包括Linux、Mac和Windows设备。
另外,为了方便数据传输,作者小哥还准备了一个Python API,让开发者能够通过编程方式订阅和接收从Vision Pro流式传输的追踪数据。
API返回的数据是字典形式,包含头部、手腕、手指的SE(3)姿态信息,即三维位置和方向。开发者可以直接在Python中处理这些数据,用于对机器人的进一步分析和控制。
就像不少专业人士所指出的那样,别看机器狗的动作还是由人类控制,事实上,相比于“操控”本身,结合模仿学习算法,人类在这个过程中,更像是机器人的教练。
而Vision Pro通过追踪用户的动作,提供了一种直观、简单的交互方式,使得非专业人员也能够为机器人提供精准的训练数据。
作者本人也在论文中写道:
在不久的将来,人们可能会像日常戴眼镜一样佩戴Vision Pro这样的设备,想象一下我们可以从这个过程中收集多少数据!
这是一个充满前景的数据源,机器人可以从中学习到,人类是如何与现实世界交互的。
最后,提醒一下,如果你想上手试一试这个开源项目,那么除了必备一台Vision Pro之外,还需要准备:
苹果开发者账户
Vision Pro开发者配件(Developer Strap,售价299美元)
安装了Xcode的Mac电脑
嗯,看样子还是得先让苹果赚一笔了(doge)。
项目链接:
https://github.com/Improbable-AI/VisionProTeleop?tab=readme-ov-file
参考链接:
https://twitter.com/younghyo_park/status/1766274298422161830
英国AI初创公司Stability AI或将面临出售
根国外报道,英国AI初创公司StabilityAI最近几周至少与一位潜在买家就出售问题进行了讨论。据悉,该公司在2024年第一季度的营收不到500万美元,但却亏损超过3000万美元。更令人担忧的是,StabilityAI目前拖欠云计算供应商和其他公司近1亿美元的账单。站长网2024-05-16 17:08:350000亚马逊云科技推出新型生成式 AI 助手 Amazon Q
亚马逊云科技宣布推出一种新型生成式AI助手AmazonQ,专为满足办公场景的需求而设计。AmazonQ可以根据客户的业务进行定制,帮助员工快速获得复杂问题的答案、生成内容并采取行动。它可以根据企业的人员、角色和权限进行个性化定制,并确保客户的内容不会被用于训练AmazonQ的底层模型,保障数据安全和隐私。站长网2023-12-07 09:18:520000Google Messages 推出 Gemini 功能 增强用户交互体验
Google在I/O2024大会上宣布的一项新功能——Gemini,已在GoogleMessages应用中向稳定用户广泛推出。这项新功能紧随GeminiAdvanced中的Gemini1.5Pro和YouTubeMusicGeminiExtension等最近推出的功能。站长网2024-05-27 15:07:240000阿里云推出针对Llama 3系列模型限时免费训练、部署、推理服务
最近,Meta公司发布了全新的Llama3系列,而阿里云魔搭社区迅速响应,将这一系列的四款模型全部上架。今天,阿里云百炼大模型服务平台更是宣布,将提供针对Llama3系列的限时免费训练、部署和推理服务,旨在帮助企业和开发者利用这一强大工具,快速构建属于自己的专属大模型。站长网2024-04-22 10:44:380001设计师早下班AI神器来了!图片处理秒出图
今天推荐的设计免费AI神器就是美间AI旗下的智能抠图工具。AI智能抠图小程序地址:https://kujiale.com/mp/60VE4GUU72q体验地址:https://www.meijian.com/mj-box/ai-pic-matting-intro?utm_source=zz看到发丝级精准,无需PS这个标语,瞬间泪目了…想起初学PS时那难以控制的套索工具。站长网2024-07-09 17:21:010000