首页站长资讯UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官

UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官

站长网2024-01-22 14:16:281阅

要点:

UCLA等机构的研究人员最近推出了具身智能大模型MultiPLY，该模型具备多模态感知能力，包括触觉、视觉、听觉等，使得AI能够更全面地与3D环境进行交互。

通过与3D环境的交互，MultiPLY在对象检索、工具使用、多感官标注和任务分解等具体任务实验中，表现出比当前技术水平更高的性能。

为了训练MultiPLY，研究人员创建了一个大规模多感官数据集Multisensory-Universe，包含50万条由AI智能体在3D虚拟环境中交互时收集的数据，涵盖了多种任务类型。

近日，UCLA等机构的研究人员推出了具身智能大模型MultiPLY，该模型不仅具备多模态感知能力，包括触觉、视觉、听觉等，使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。

MultiPLY在多任务实验中表现出色，包括对象检索、工具使用、多感官标注和任务分解等，刷新了当前技术水平。为了训练这一新模型，研究人员创建了Multisensory-Universe数据集，包含50万条多感官数据，涵盖了多种任务类型。尽管面临挑战，如当前缺少训练多感官交互的数据和正确表示3D场景的多感官信息，但MultiPLY的出现为实现AGI提供了新的方向。

在模型训练阶段，研究人员引入了新物体，并通过触觉、环境声音、撞击声音、温度等多种传感器数据获取方式，让模型学会感知物体的多模态信息。

为此，研究人员提出了多感官全景生成管线，通过不同传感器收集触觉、声音、温度等信息。整个训练过程中，MultiPLY通过智能体与3D环境交互，生成多感官观测值，并在推理过程中不断生成动作token，展现出强大的多模态能力。这一研究的出现，为构建更全面、具备多感官能力的大模型提供了新思路。

UCLA提出多模态具身智能大模型MultiPLYAI首次拥有类人感官

0001

评论列表

共(0)条

相关推荐

站长资讯
今晚8点2024天猫618现货开卖：iPhone 15系列大降价最高优惠2300元
快科技5月20日消息，据天猫官方介绍，2024天猫618将于今晚8点正式开启。这次的天猫618被称为史上最简单实惠的618”，取消了繁琐的预售流程，直接就是现货开售，优惠价直接展示出来，也不用做数学题了。从目前官方公布的活动内容来看，今晚有五折会场重磅回归，百亿补贴全家桶低至2折，88VIP大额券门槛降低等活动。
站长网2024-05-21 01:20:57
0000
站长资讯
76家上市游戏公司年报：近七成游戏收入下滑，18家公司提及AIGC应用
去年上市游戏公司的年度财报还是比想象的惨淡。《2022年中国游戏产业报告》显示，去年中国游戏市场实际销售同比下降14.4%，少见地出现了负增长。Newzoo的报告也表明，全球游戏市场规模在2022年首次迎来下滑。冷淡的行情在上市公司的业绩中体现出来了。
站长网2023-05-09 10:32:21
0000
站长资讯
FF发布Q1财报称FF91已生产40辆
今日，法拉第未来FaradayFuture（FF）发布2023年第一季度财报称，一季度净收入为650万美元，季度损失为1.531亿美元。
站长网2023-05-12 14:11:57
0000
站长资讯
颠覆任天堂？首个AI游戏引擎Buildbox 4 Alpha问世
要点:首个AI游戏引擎Buildbox4Alpha问世，能通过简单文字指令生成游戏资产和动画。黄仁勋预测未来5-10年游戏完全由AI生成，将颠覆传统游戏开发方式。AI技术在游戏开发中的应用将使游戏创作变得更加高效和普及化。
站长网2024-03-25 19:12:14
0000
站长资讯
苹果计划推出可穿戴创意包括智能眼镜和耳内摄像头
苹果公司最近宣布了其计划，他们正考虑探索未来可穿戴设备的新方向。据悉，苹果正推出一款智能眼镜和配备摄像头的AirPods，这些概念仍然是公司内部的探索阶段。
站长网2024-02-26 10:09:19
0000