北大等发布智能体Jarvis-1 轻松玩转“我的世界”
要点:
北大、北邮、UCLA和BIGAI联合发布的智能体 Jarvis-1在开放世界游戏「我的世界」中取得重大突破,采用多模态 记忆增强 多任务处理,表现出卓越的规划和控制能力。
Jarvis-1通过多模态感知、记忆增强和终身学习,在「我的世界」游戏中展现出近乎完美的性能,成功完成包括合成钻石镐等复杂任务,超越了现有方法的性能水平。
Jarvis-1的成功归功于从LLM到MLM的感知能力升级、多模态记忆的应用以及自我指导和自我完善的能力,标志着通用智能体迈向了更高的学习、适应和改进水平。
最近,北大、北邮、UCLA和BIGAI的研究团队合作发布了一款名为 Jarvis-1的智能体,引起了广泛关注。该智能体在开放世界游戏「我的世界」中表现出色,实现了多模态感知、记忆增强和多任务处理。研究人员在论文中详细介绍了 Jarvis-1的实现过程以及其在游戏中的卓越表现。
Jarvis-1的实现过程主要包括在预训练的多模态语言模型基础上进行开发,将观察和文本指令映射到计划中,并通过多模态存储器提供先前训练和实际游戏经验的参考。在实验中,Jarvis-1在「我的世界」游戏的不同任务中表现出近乎完美的性能,尤其在合成钻石镐任务中成功率达到惊人的12.5%。

论文地址:https://arxiv.org/pdf/2311.05997.pdf
这一成功背后的关键因素包括从LLM到MLM的感知能力升级,通过多模态感知获得丰富的环境反馈,以及利用多模态记忆实现规划的正确性和一致性。Jarvis-1还展现出自我指导和自我完善的能力,通过终身学习和记忆,不断提高任务完成的效率和准确性。
然而,在实现开放世界游戏的过程中,研究人员也面临一些主要挑战。首先,开放世界意味着任务完成的途径不唯一,需要智能体具有审时度势的能力。其次,在执行高复杂度任务时,由大量小任务组合而成,每个小任务的达成都具有一定难度。最后,终身学习成为挑战,因为开放世界中的任务数目巨大,无法预先全部习得,需要智能体在规划的过程中不断进行学习。
Jarvis-1的发布标志着通用智能体在开放世界环境中取得了重要进展,展示了更高水平的规划、控制和学习能力。这对于人工智能领域的发展具有积极意义,为未来智能体的研究和应用提供了有益的经验和启示。
东京大学开发仿人机器人Alter3 能执行ChatGPT指令
Alter3是由日本东京大学开发的一种仿人机器人。研究人员通过将Alter3与GPT-4相连接,成功实现了让机器人模仿人类行为的目标。为了让机器人执行各种动作,研究人员向Alter3发送了一系列的指令。通过使用大型语言模型,这些书面指令被转化为机器人可以执行的代码。这样一来,Alter3就能够像人类一样弹奏吉他、自拍、扮演鬼魂角色,甚至偷吃电影院里别人的爆米花。站长网2024-01-05 10:46:100001市监总局发布双11促销合规提示:电商严禁二选一
随着年度购物盛事双11的到来,无数消费者已经开始积极准备,领取各种优惠券并开始囤积心仪的商品。然而,这一时期也是网购纠纷的高发期。为了规范商家的促销行为,确保网络交易的秩序,并保护消费者的合法权益,市场监管总局发布了《双11网络集中促销合规提示》,旨在指导主要电商平台在双11期间的合规经营。0000亚马逊上线生成式 AI 工具来总结客户真实的产品评价
亚马逊于周一宣布推出一种新的生成式AI工具,它将为每个产品总结客户的评论。AI工具将总结最经常提到的产品特点和常见的客户意见,以一段文字的形式显示在产品详细页面旁边,而不是让用户费力地筛选数百甚至数千个客户的个性化评论。站长网2023-08-15 08:57:490000餐饮生存战:平价消费时代,别盲目卷低价
最近「定焦One」发布了一篇文章《“3元管饱”,平价快餐店卷起来了》,引发很多消费者和餐饮人共鸣,多位消费者留言分享自己的“省钱妙招”和“私藏宝店”,餐饮人则表示也注意到行业已经进入平价时代,准备主动出击,抓住这一波消费趋势。针对这些反馈,「定焦One」再次和多位餐饮从业者进行了深入交流,希望更加全面的呈现当前的餐饮现状,以及平价时代存在的转型机会,给更多餐饮人参考和借鉴。0000直播电商价值再审视:低价之外,是什么吸引品牌与用户
直播电商仍旧是先进生产力的代表,但品牌、主播、用户需要在新形势下达成新一轮的利益平衡。尽管各家平台都没有公布具体的销售数额,但第三方数据平台显示,今年双11的总体成交额徘徊在低个位数。其中,此前动辄增速高达三位数的直播电商,今年增速仅仅维持在20%左右,天花板已然可见。0000