UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官
站长网2024-01-22 14:16:281阅
要点:
UCLA等机构的研究人员最近推出了具身智能大模型MultiPLY,该模型具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。
通过与3D环境的交互,MultiPLY在对象检索、工具使用、多感官标注和任务分解等具体任务实验中,表现出比当前技术水平更高的性能。
为了训练MultiPLY,研究人员创建了一个大规模多感官数据集Multisensory-Universe,包含50万条由AI智能体在3D虚拟环境中交互时收集的数据,涵盖了多种任务类型。
近日,UCLA等机构的研究人员推出了具身智能大模型MultiPLY,该模型不仅具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。

MultiPLY在多任务实验中表现出色,包括对象检索、工具使用、多感官标注和任务分解等,刷新了当前技术水平。为了训练这一新模型,研究人员创建了Multisensory-Universe数据集,包含50万条多感官数据,涵盖了多种任务类型。尽管面临挑战,如当前缺少训练多感官交互的数据和正确表示3D场景的多感官信息,但MultiPLY的出现为实现AGI提供了新的方向。

在模型训练阶段,研究人员引入了新物体,并通过触觉、环境声音、撞击声音、温度等多种传感器数据获取方式,让模型学会感知物体的多模态信息。
为此,研究人员提出了多感官全景生成管线,通过不同传感器收集触觉、声音、温度等信息。整个训练过程中,MultiPLY通过智能体与3D环境交互,生成多感官观测值,并在推理过程中不断生成动作token,展现出强大的多模态能力。这一研究的出现,为构建更全面、具备多感官能力的大模型提供了新思路。
0001
评论列表
共(0)条相关推荐
今晚8点2024天猫618现货开卖:iPhone 15系列大降价 最高优惠2300元
快科技5月20日消息,据天猫官方介绍,2024天猫618将于今晚8点正式开启。这次的天猫618被称为史上最简单实惠的618”,取消了繁琐的预售流程,直接就是现货开售,优惠价直接展示出来,也不用做数学题了。从目前官方公布的活动内容来看,今晚有五折会场重磅回归,百亿补贴全家桶低至2折,88VIP大额券门槛降低等活动。站长网2024-05-21 01:20:57000076家上市游戏公司年报:近七成游戏收入下滑,18家公司提及AIGC应用
去年上市游戏公司的年度财报还是比想象的惨淡。《2022年中国游戏产业报告》显示,去年中国游戏市场实际销售同比下降14.4%,少见地出现了负增长。Newzoo的报告也表明,全球游戏市场规模在2022年首次迎来下滑。冷淡的行情在上市公司的业绩中体现出来了。站长网2023-05-09 10:32:210000FF发布Q1财报 称FF91已生产40辆
今日,法拉第未来FaradayFuture(FF)发布2023年第一季度财报称,一季度净收入为650万美元,季度损失为1.531亿美元。站长网2023-05-12 14:11:570000颠覆任天堂?首个AI游戏引擎Buildbox 4 Alpha问世
要点:首个AI游戏引擎Buildbox4Alpha问世,能通过简单文字指令生成游戏资产和动画。黄仁勋预测未来5-10年游戏完全由AI生成,将颠覆传统游戏开发方式。AI技术在游戏开发中的应用将使游戏创作变得更加高效和普及化。站长网2024-03-25 19:12:140000苹果计划推出可穿戴创意包括智能眼镜和耳内摄像头
苹果公司最近宣布了其计划,他们正考虑探索未来可穿戴设备的新方向。据悉,苹果正推出一款智能眼镜和配备摄像头的AirPods,这些概念仍然是公司内部的探索阶段。站长网2024-02-26 10:09:190000