UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官
站长网2024-01-22 14:16:280阅
要点:
UCLA等机构的研究人员最近推出了具身智能大模型MultiPLY,该模型具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。
通过与3D环境的交互,MultiPLY在对象检索、工具使用、多感官标注和任务分解等具体任务实验中,表现出比当前技术水平更高的性能。
为了训练MultiPLY,研究人员创建了一个大规模多感官数据集Multisensory-Universe,包含50万条由AI智能体在3D虚拟环境中交互时收集的数据,涵盖了多种任务类型。
近日,UCLA等机构的研究人员推出了具身智能大模型MultiPLY,该模型不仅具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。
MultiPLY在多任务实验中表现出色,包括对象检索、工具使用、多感官标注和任务分解等,刷新了当前技术水平。为了训练这一新模型,研究人员创建了Multisensory-Universe数据集,包含50万条多感官数据,涵盖了多种任务类型。尽管面临挑战,如当前缺少训练多感官交互的数据和正确表示3D场景的多感官信息,但MultiPLY的出现为实现AGI提供了新的方向。
在模型训练阶段,研究人员引入了新物体,并通过触觉、环境声音、撞击声音、温度等多种传感器数据获取方式,让模型学会感知物体的多模态信息。
为此,研究人员提出了多感官全景生成管线,通过不同传感器收集触觉、声音、温度等信息。整个训练过程中,MultiPLY通过智能体与3D环境交互,生成多感官观测值,并在推理过程中不断生成动作token,展现出强大的多模态能力。这一研究的出现,为构建更全面、具备多感官能力的大模型提供了新思路。
0000
评论列表
共(0)条相关推荐
淘宝斗地主大赛热度超过原神 活跃用户超4000万
近日,淘宝宣布启动为期2个月的“淘宝夏日季”,其中淘宝杯斗地主全国赛于7月24日正式开赛,每天可多次参与比赛,每周通过积分排名的方式获得奖励。用户可以在淘宝搜索“淘宝斗地主”参与。淘宝每周日还针对周排名前列的用户开展周淘汰赛,获胜者有机会赢得汽车、金条等福利,每日参与有机会领红包、抽茅台。站长网2023-08-02 14:58:080000荣耀Magic6 RSR保时捷设计今晚发布!成龙将亮相直播间
快科技3月18日消息,荣耀将于今晚召开新品发布会,正式推出联手保时捷设计打造的首款直板机荣耀Magic6RSR保时捷设计。值得注意的是,荣耀今晚还将同步在京东直播间进行直播,官方预告中还透露有神秘重磅嘉宾,海报剪影上毫无疑问就是成龙。据悉,荣耀在今年1月份的Magic6发布会后,宣布成龙担任荣耀龙年大使。此后成龙多次在荣耀的宣传视频中现身,并且在试用新机后多次点赞鹰眼相机。站长网2024-03-18 15:44:030000劳斯莱斯:首款电动车Spectre需求强劲,现在下订2025年才能交付
近日,出席在意大利科莫湖举办的ConcorsoD’EleganzaVillaD’Este汽车节活动上,劳斯莱斯首席执行官就公司首款电动汽车的市场表现发表了看法。TorstenMüller-Ötvös谈到:“用户对这款电动汽车需求非常高,如果你现在下单,车辆交付可能会等到2025年。”站长网2023-05-24 20:44:020000让马斯克和扎克伯格跳“科目三”,这可能是最懂社会摇的AI视频工具
AI视频领域又火了一款工具。只需上传一张照片,就能让马斯克跳TikTok社会摇。(强烈推荐配合视频食用,注意⚠️有音乐)这段视频由最近悄悄走红的MagicAnimate生成。这一股扑面而来的社会摇味儿,背后原因无他,靠着短视频发家的字节跳动也下场做起了AI视频生成工具。0005仅付一天工资,好莱坞电影公司想用AI长期代替群演遭抵制
好莱坞制片公司计划用人工智能取代群众演员,仅支付他们一天的工资。制片公司提议使用AI扫描群众演员,拥有他们的图像和肖像权,并将其用于未来任何项目中,而无需经过同意或给予补偿。站长网2023-07-14 17:24:460000