谷歌展示首个大模型实时游戏模拟引擎,重塑游戏开发流程
传统的游戏引擎依赖手动编码,通过循环处理用户输入、更新游戏状态来完成游戏的开发,这种方法费时且成本非常高。
谷歌的研究人员基于开源扩散模型Stable Diffusion1.4开发了实时游戏模拟引擎GameNGen,可以在单个TPU上以超过20帧每秒的速度交互式模拟了经典射击游戏《DOOM》。
随后邀请了人类对GameNGen模拟的游戏进行评估,结果显示,人类几乎无法分别出哪个一个是AI模拟的游戏,这是因为GameNGen在模拟游戏时,不只是简单地复制视觉效果,还能维持复杂的内部状态更新。
例如,可以正确地计算玩家的生命值、弹药数量,攻击敌人,破坏物体,打开门等,并且这些状态变化能够持续多帧形成连贯的视觉效果,进一步增强了模拟的真实性。
GameNGen模拟的经典设计游戏《Doom》
虽然GameNGen的功能异常强大,但在架构和训练方面并不复杂,主要由两大部分组成。第一阶段,通过训练一个智能体来模拟人类玩家的各种游戏行为,通过与游戏环境的交互,生成了一系列的动作和观察数据。
这些数据不仅包括玩家的输入,按键和鼠标移动,还包括游戏的输出,屏幕上渲染的像素等。该数据后续会被用来训练生成模型,使其能够学习如何根据玩家的输入和游戏的当前状态来预测游戏的下一帧。
为了使智能体更好地执行多种动作,研究人员还设置了奖励函数,包括玩家被击中(-100分)、玩家死亡(-5000分)、击中敌人(300分)、杀死敌人(1000分)、拾取物品 / 武器(100分)、发现秘密(500分)等。此外,为了鼓励智能体流畅地模拟人类玩法,每个动作会应用4帧,并人为增加重复上一个动作的概率。
第二阶段,在训练生成模型时,研究人员选了开源的扩散模型Stable Diffusion v1.4作为基础模型,并对其进行了调整以适应游戏模拟的复杂需求。通过编码过去的帧和动作来预测下一帧,该过程涉及到将过去的帧编码到潜在空间,并将其与噪声结合来生成新的帧。这种编码和预测的过程是GameNGen能够实时生成高质量游戏画面的技术关键。
为了解决自回归生成过程中可能出现的样本质量快速下降难题,研究人员引入了“噪声增强”技术。这种方法通过在训练时向编码帧中添加不同量的高斯噪声,并在模型输入中包含噪声水平,使得网络能够在推理时校正之前帧中的错误信息。也是保持长时间轨迹稳定性的重要方法,允许模型在生成过程中不断校正和优化其预测,从而保持生成画面的连贯性和质量。
研究人员表示,虽然GameNGen还有一些技术局限,但在游戏关卡设计、游戏测试、实时场景交互等游戏开发领域帮助非常大。例如,在创建游戏场景时,传统方法可能需要开发人员逐一编写每个元素的代码,而 GameNGen 可以根据训练数据自动生成逼真的场景,包括地形、建筑和道具等。
此外,GameNGen 还能够根据玩家的行为和反馈进行实时调整和优化。可以学习玩家的游戏模式和偏好,从而为玩家提供个性化的游戏体验。例如,如果玩家倾向于某种类型的游戏策略,GameNGen 可以相应地调整游戏难度和内容,以增加游戏的趣味性和挑战性。
论文地址:https://arxiv.org/abs/2408.14837
分享10个好用的手机必装APP,娱乐工作缺一不可!
分享10个手机里必装的APP,包括5个工具类APP和5个娱乐类APP,每一个都非常实用且人性化,能给你的工作生活提供方便。阿里旗下的一款在线文档和知识管理工具。用它来建立知识库和大纲条理非常清晰,而且可以添加标签,方便分类检索,相当于给自己的零碎记录编上了档。里面提供非常多的免费模板,可以一键套用,用来做每日复盘、读书笔记、工作计划等都非常好用。站长网2023-05-24 00:43:340000陈天桥联手Science推AI驱动科学大奖!千字论文抱走3万美金,挖掘诺奖潜力股
近日,天桥脑科学研究院(Tianqiao&ChrissyChenInstitute,简称研究院)与《科学》杂志联合宣布,推出一项AI驱动科学大奖,表彰全球范围内用人工智能技术推动各个领域科学研究并取得突破性进展的青年科学家。前中国互联网大佬陈天桥,在脑科学领域深耕8年,全力投入新一代人工智能技术研发近两年,斩获颇丰,在此之际推出的这一国际大奖颇为引人瞩目。站长网2024-08-27 07:25:240000亚马逊平台涌现大量 AI 生成的虚假旅行指南
本文概要:1.AI生成的旅行指南在亚马逊上泛滥成灾,虚假声称是著名作家撰写。2.旅行指南内含通用信息,价格低廉,部分附加虚假五星级评论。3.亚马逊需要加强审核机制,以防止AI生成的欺诈产品进入市场。站长网2023-08-08 10:21:490000微软为 Windows 10 引入 AI 驱动的 Copilot 功能,扩大人工智能覆盖生态
在过去的两年中,Windows11为大多数内置应用程序带来了重大更新,包括系统托盘、开始菜单、设置应用程序和任务栏等,这些都在每次更新中不断演进。然而,这些更改中的大多数并未应用于仍然是地球上最广泛使用的Windows版本——Windows10。值得注意的例外包括重新设计的Outlook应用程序和MicrosoftEdge的持续开发。站长网2023-11-17 09:17:520001“2亿诈骗案”一年后,AI换脸犯罪更疯狂了
定制换一张脸成本有多高?答案是——只需要一杯奶茶钱。在各大平台上,换脸服务比比皆是,只需要9块9,就能迅速获得一个真假难辨的换脸内容。随着AI技术的迅速演进,有关DeepFake(深度伪造)的讨论也愈演愈烈。0000