科幻片成真!Figure与OpenAI合作新进展 Figure 01接入ChatGPT后成“精”了!
站长网2024-03-14 11:11:052阅
Figure最新展示了他们与OpenAI合作的成果,这一合作让他们的机器人获得了惊人的能力。机器人可以进行语音对话、描述周围环境、做出决策推理、执行高层次请求,并口头解释推理过程。这些功能使得机器人能够执行类似人类的快速、灵巧动作,表明这一合作取得了显著进展。

Figure的机器人具有以下主要功能和能力:
描述周围环境、使用常识推理做出决策、将高层次请求转化为适当的行为,以及用简单英语描述执行特定动作的原因。这些能力都是机器人通过学习得来的,而不是遥控操作,并且以正常速度运行。
技术方面,机器人通过将摄像头获取的图像和麦克风捕获的转录文本输入到一个大型的多模态模型中,实现了视觉和语言理解。该模型由OpenAI训练,负责决定运行哪种学习到的闭环行为以满足给定的命令,并执行相应的策略。
这一成果展示了如何通过综合应用多模态理解能力和机器学习,实现与机器人的自然交互和智能行为规划。OpenAI提供了视觉推理和语言理解能力,而Figure的神经网络则实现了快速、低级别、灵巧的机器人动作。这一合作旨在推动机器人学习的边界,为人形机器人开发AI模型。
Figure的机器人使用搭载摄像头和OpenAI训练的大型视觉语言模型(VLM),实现了200Hz的24自由度动作。此外,Figure在工程方面进行了垂直整合,包括电机、固件、热管理和电子设备等。这些努力使得机器人的动作速度显著加快,接近人类速度,展示了合作的巨大潜力和成果。
0002
评论列表
共(0)条相关推荐
苹果拿出史上最好财报:一个季度营收超9000亿元 刷新历史纪录
快科技1月31日消息,苹果公司今日发布了2025财年第一季度(对应自然年2024年第四季度)的财务报告,营收达到1243亿美元(约合人民币9013.5亿元)。这一数字较去年同期的1196亿美元增长了4%,并创下了季度营收的新纪录。同期,苹果的净利润达到了363亿美元(约合人民币2634.8亿元),同比增长4%。0000Open-Sora悄悄升级 支持16秒视频生成和720p分辨率
Open-Sora在开源社区悄悄更新了,现在,该项目不仅支持长达16秒的单镜头视频生成,而且视频分辨率最高可达720p,能够处理各种宽高比的文本到图像、文本到视频、图像到视频、视频到视频以及无限长视频的生成需求。技术报告与模型架构:Open-Sora技术报告已在GitHub上发布,详细介绍了新功能和模型架构。作者团队对STDiT架构进行了关键性改进,提高了模型的训练稳定性和整体性能。站长网2024-04-26 00:47:350000如何拿捏Z世代?我盘点了快手粉丝数最多的20个二次元IP
“2023年,快手二次元经历了一次认知升级,从原来的以品类为核心,变得更注重IP和IP二创内容。”谈及年初快手首届次元IP盛典的举办,快手二次元负责人刘舟说。二次元一向是各大平台的兵家必争之地,快手也不例外。自2019年宣布投入30亿流量扶持二次元创作者,快手二次元就开始了蓬勃发展。快手次元IP盛典既是快手二次元IP成果的一次集中展示,也是快手继续加码二次元的信号。站长网2024-02-26 21:33:310000研究警告:到2026年,AI训练数据可能告急
划重点:1.高质量数据对AI至关重要:强大、准确和高质量的AI算法需要大量高质量的数据来进行训练。2.AI数据可能告急:研究人员预测,如果当前的AI训练趋势继续下去,高质量文本数据可能在2026年之前告急,而低质量的语言数据和图像数据也将在未来告急。站长网2023-11-08 16:47:410000unisim:可交互的真实世界AI模拟器 提供仿真体验
unisim是一款创新的互动模拟器,经过生成模型的训练,可以以连贯的方式模拟对人类、机器人和其他互动代理进行的动作,并为它们提供仿真体验。这一技术代表了生成模型的下一个重要里程碑,可以用于从游戏和电影中的可控内容创建,到在仿真中训练直接在真实世界中部署的实体代理。地址:https://universal-simulator.github.io/unisim/站长网2023-10-16 10:17:250002