UCLA提出多模态具身智能大模型MultiPLY AI首次拥有类人感官
站长网2024-01-22 14:16:281阅
要点:
UCLA等机构的研究人员最近推出了具身智能大模型MultiPLY,该模型具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。
通过与3D环境的交互,MultiPLY在对象检索、工具使用、多感官标注和任务分解等具体任务实验中,表现出比当前技术水平更高的性能。
为了训练MultiPLY,研究人员创建了一个大规模多感官数据集Multisensory-Universe,包含50万条由AI智能体在3D虚拟环境中交互时收集的数据,涵盖了多种任务类型。
近日,UCLA等机构的研究人员推出了具身智能大模型MultiPLY,该模型不仅具备多模态感知能力,包括触觉、视觉、听觉等,使得AI能够更全面地与3D环境进行交互。这标志着具备多感官能力的大模型成为未来AI发展的重要方向。
MultiPLY在多任务实验中表现出色,包括对象检索、工具使用、多感官标注和任务分解等,刷新了当前技术水平。为了训练这一新模型,研究人员创建了Multisensory-Universe数据集,包含50万条多感官数据,涵盖了多种任务类型。尽管面临挑战,如当前缺少训练多感官交互的数据和正确表示3D场景的多感官信息,但MultiPLY的出现为实现AGI提供了新的方向。
在模型训练阶段,研究人员引入了新物体,并通过触觉、环境声音、撞击声音、温度等多种传感器数据获取方式,让模型学会感知物体的多模态信息。
为此,研究人员提出了多感官全景生成管线,通过不同传感器收集触觉、声音、温度等信息。整个训练过程中,MultiPLY通过智能体与3D环境交互,生成多感官观测值,并在推理过程中不断生成动作token,展现出强大的多模态能力。这一研究的出现,为构建更全面、具备多感官能力的大模型提供了新思路。
0001
评论列表
共(0)条相关推荐
OPPO:下一代Find旗舰支持卫星通信
OPPO今日宣布,其下一代Find旗舰产品将支持卫星通信技术,这意味着用户可以在更广泛的范围内进行通信,特别是在偏远地区或灾害情况下,这一技术将提供更加可靠和快速的通信服务。据OPPO官方预热,下一代Find旗舰产品将是即将发布的OPPOFindX7手机。这款手机将搭载新一代超光影影像系统,并与哈苏联合打造,为用户带来更加高质量的照片和视频体验。站长网2023-11-10 11:53:050000雷军拿奖学金时发誓要1万倍奉还:希望支持武大学科进步
昨日,小米的创始人雷军在央视新闻的采访中,谈及了他向武汉大学捐款的背后故事。他深情地回忆道:“在我求学的日子里,奖学金曾是我生活的重要支撑。那时,我就立下了一个誓言,将来要以万倍之力回馈。”此次捐款,于他而言,不仅是为了实现当年的心愿,更是希望为武大的学科进步贡献力量,培养更多优秀的程序员和工程师。站长网2024-04-29 14:19:280000Adobe 称印度是其增长最快的市场之一
划重点:-🚀Adobe在印度市场取得了快速增长,助力各行业企业采用数字化解决方案。-💻Adobe计划在印度推出数据中心基础设施,以满足当地数据法规和提高性能。-🎨Adobe致力于负责任地使用生成式AI,保护知识产权并与其他机构合作。AdobeIndia是Adobe公司的第二大部门,如今拥有超过8000名员工,从1997年的单一开发中心发展成为全球企业。站长网2024-05-22 15:13:060000一年产能全卖光了:消息称小米汽车锁单破10万
快科技5月9日消息,据汽车博主孙少军”爆料,小米汽车锁单量正式超过10万。小米SU7于3月28日晚上市,迄今刚超40天,上市当晚就疯狂揽收订单,27分钟内大定破5万台。在4月3日举办的小米SU7首批交付仪式上,雷军宣布,小米SU7开售仅短短几天时间,就有超过10万人下定,锁单量已超过4万单。站长网2024-05-09 16:45:210000不会找对标,赚钱慢人一步!
各位村民好,我是村长不管你做什么,一定要有对标。比如线下餐饮你要向学习别人,同一条马路、同一个片区,甚至是同一个城市,哪个做的好。而我们做线上的店铺、抖音账号也是如此。关注同行、找到对标有三个明显的好处:其一,知道什么是优秀的标准,别人哪些地方值得你学习。其二,同行提前为了避了很多坑,什么内容没有播放量,什么内容争议大,都可以及时关注。0000