谷歌推出通用AI代理SIMA:3D游戏世界的全能AI玩家
划重点:
🤖 无需源代码或API,SIMA通过文本和图像提示执行操作
🎮 与多个游戏工作室合作,SIMA在多款3D游戏中展现卓越性能
🔍 由多种大模型组成的SIMA,模仿人类感知、思考、规划和执行
正文:
近日,谷歌DeepMind的研究团队宣布推出一款面向3D虚拟环境的通用AI代理——SIMA。这一创新成果标志着AI技术在游戏领域的应用迈出了重要一步。SIMA的独特之处在于,它能够无需游戏的源代码或定制API,仅依赖于用户提供的图像和简单文本指令,就能像人类玩家一样在游戏世界中自由行动。
SIMA的研发过程中,DeepMind与八家游戏工作室紧密合作,将其在《无人深空》、《模拟山羊3》、《Teardown》、《挖矿模拟器》等多款知名3D游戏中进行了广泛测试。测试结果显示,SIMA能够执行超过600种基本操作,包括挖矿、驾驶飞船、制作装备等,且每项操作的完成时间平均不超过10秒。
SIMA的架构设计灵感来源于人类的身体构造,由多种大模型组合而成。其中,视觉感知模型相当于AI的“眼睛”,负责处理图像观察并提取关键信息;大语言模型则是“大脑”,解析和理解自然语言指令;建模规划模型扮演“思维”的角色,通过强化学习规划最佳行动策略;最后,控制和执行模型作为“四肢”,将动作序列转化为实际的游戏控制指令。
在数据收集和预处理方面,SIMA采用了先进的技术手段。研究人员从商业游戏中收集了大量数据,并通过数据清洗、转换和标准化等步骤,确保了数据的质量和一致性。这些工作为SIMA的学习和执行提供了坚实的基础。
谷歌DeepMind的研究人员表示,他们将继续迭代和提升SIMA的通用代理能力,期望未来SIMA能在现实生活中为用户提供更多帮助。
技术报告:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/sima-generalist-ai-agent-for-3d-virtual-environments/Scaling%20Instructable%20Agents%20Across%20Many%20Simulated%20Worlds.pdf
iOS17.1改进iPhone15Pro按钮功能 避免口袋内误触
根据国外媒体的报道,苹果公司近日向开发者发布了iOS17.1第三个测试版。此次更新带来一个新功能,可以检测iPhone是否在用户口袋里,从而改变iPhone15Pro系列操作按钮的行为方式。站长网2023-10-11 16:36:290000抖音治理网络“戾气”内容 打击“网络厕所”“开盒挂人”等行为
抖音发布《关于治理网络“戾气”内容的公告》称,近期,针对网络存在的“戾气”内容,平台将开展专项,进行整治。抖音表示,抖音一直强调记录真实而美好的生活,呼吁广大用户在平台理性、友善发言,打造风清气正的社区氛围。与此同时,平台也从严打击攻击谩骂、挑起群体对立、宣泄极端情绪等突出问题。具体包括:站长网2023-11-20 08:38:300000这届网友,在小红书复盘了春晚名场面
过去二十多年总是一个人看春晚、偶尔和亲戚交换两句意见的阿雯,这个春节在小红书上找到了一堆“春晚搭子”。在看龙年春晚之余,阿雯不时低下头刷小红书,并飞快地在感兴趣的帖子下发出春晚“弹幕”:站长网2024-02-16 10:53:380000蚂蚁集团井贤栋:即将发布的大模型是全栈分布、纯自研的
9月7日,第二届外滩大会在上海开幕。在外滩大会主论坛“科技、金融、产业,融合发展新未来”圆桌对话上,联合国开发计划署可持续金融中心高级顾问迈克尔·舍伦、北京智源人工智能研究院顾问、美国国家工程院外籍院士张宏江、蚂蚁集团董事长兼CEO井贤栋和资深媒体人秦朔,就人工智能、数字科技与产业变革、金融发展进行了深度探讨。站长网2023-09-07 16:27:150000华为nova 12系列即将发布 4款机型曝光
华为官方宣布,即将开售nova12系列新品。根据博主数码闲聊站的透露,这次华为nova12系列共有4款机型,包括nova12、nova12活力版、nova12Pro和nova12Ultra。在影像方面,华为nova12系列后置5000万像素RYYB主摄。RYYB传感器通过替换两个绿色像素为黄色像素,可以显著提高进光量,提升暗光环境下的拍摄效果。0000