AI产生自我意识,「古墓丽影」劳拉觉醒!电子游戏革命来了
【新智元导读】一位外国up主,用ChatGPT给AI智能体注入了自我意识。产生「生命」的劳拉觉醒了,开始自己在「古墓丽影」中闯关。
如果游戏角色被注入生命,电子游戏会发展成什么样?
曾经,这是不少人的畅想,而如今,随着AI智能体的发展,这种想象已经开始走入现实。
最近,一位YouTube作者Foxmaster制作了一个经典游戏「古墓丽影」的原版视频。
而其中的女主角劳拉,居然是一个能控制自己角色的AI智能体!
可以说,利用机器视觉、定位、物体识别、动画、文本和语音等各种AI工具,Foxmaster为游戏角色注入了数字生命。
就在前几天,爆火AI社区的斯坦福智能体小镇正式开源。25个各具个性的AI智能体,在「西部世界」一般的沙盒虚拟城镇中生活、上班、交友。
所以,或许这就是电子游戏的未来?
新智元,赞55
「古墓丽影」女主有了意识
构建可以玩游戏的虚拟AI,这个概念已经很常见。不过,Formaster想做的,是让这个角色如同真人一样。
因此,他选择了「古墓丽影」这款游戏,游戏主角劳拉是一个人物性格鲜明、定义明确的角色。
而Formaste希望,这种个性会对游戏的最终结局产生影响。
如何让这个AI智能体Lara Croft在游戏中真正产生自我意识?
Formaster经过以下几个步骤的探索,终于成功了。
学习游戏规则
首先第一步,叫她学会游戏规则。「古墓丽影」已经给出了教程,解释了所有的游戏控制过程。
作者让Lara按照给出的方式去练习,像人类玩家一样完成各个阶段的教程。
教程在Lara离开泳池时结束,所以可以在那时重启程序,做出改进。
开始时,改进Lara非常困难。
她有时会出现混乱,在地图中随意走动,甚至有时候会卡在菜单栏中,一遍遍盯着她的指南针。
为了解决这个问题, 作者在一台虚拟机上,重新调整了主时钟,将游戏进程加速了40倍。这个办法起作用力,AI智能体终于在相对不错的时间内,完成了教程。
然而,还存在一个问题:Lara经常卡在一个位置,而且每个关卡都是由静态元素组成,因此只有一条优化路径。
这会导致她只知道不走哪些路径,而不是想出更全面的方法来解题。但作者希望的是,Lara学会自己去发掘探险过程。
考虑到Lara唯一掌握的知识,仅仅是每道关卡显示的屏幕上的内容,作者观察了从未玩过游戏的人类玩家的行为。
有的人会看完整个教程,有的人先会探索周围的环境,而这些选择的差异,就是由不同人的「个性」决定的。
而Lara需要学习的,恰恰就是这种态度。
识别角色
为了给AI建立与Lara的联系,就需要让AI明白,她是一堆像素。人类玩家进入游戏后,一下子有了这样的意识。
对此,作者从各个角度,录制了24个小时,Lara朝着不同方向活动的视频,以便AI智能体能够识别任何给定角色。
就像自动驾驶汽车一样,能够以每秒30帧速度拍摄24小时视频,得到2592000张参考图像,以识别道路标志。
首先,作者跟踪头部主要像素,然后是身体主要像素,来选择相关区域。
为了确保Lara出现在每张图像中,作者要求程序去识别那些不包含任何突出显示的图片。
当Lara占据整个屏幕时,或当一个二维物体挡在她面前,作者使用AI视觉捕获来帮助识别Lara,结果非常准确,足以识别屏幕上的角色。
环境互动
能够识别Lara后,需要让AI与环境互动。
整个游戏环境都是由同样的区块组成,作者将其导入到立方体上,然后从各个角度捕获环境,再运行识别过程,这样AI智能体就能识别出环境,就像人类玩家解释图像的过程。
红色突出显示的区域是,未能识别的纹理。但是,AI仍旧缺乏想去某个地方的意识,还需要知道自己距离周围环境的距离。
有趣的是,这些未能识别的区域,通常是远离Lara的位置,或被其他2D物体遮挡的位置。
当我们观察人类玩家的行为,看到这张图像后,我们能够立即明白,箭头所指向区域是一个入口。
我们可能不知道下一个房间的大小,但我们知道这是存在的。
但是,这也可能是一种视觉错觉。当我们去移动,入口区域的纹理与其他地方不同,这是3D空间的特征。
因此,AI智能体还得学会移动,并进行比较。从计算角度来看,可以使用多个图像来确定哪些纹理尺寸的变化最小。
这里可以使用主多边形的面积来算,它们的变化主要基于彼此之间距离成比例的概率。
想象
现在,AI已经知道自己身在何处了,她必须做出决定,自己下一步要去哪里。
通过识别纹理,可以让她到达特定的位置,然而在关卡中导航,需要更简单的东西。
最快的方法,就是简化对比度,识别区域中光线的突然变化。但是,人类玩家不一定会去这些地方。
当有多个开口时,AI必须表现出足够兴趣,但不能导致她死亡。
比如,如果一个洞太深,就无法在不抓住周围壁架的情况下跳下去。假如下面有水存在,倒是有可能值得这种冒险。
人类玩家知道什么时候可以跳,但Lara的行动方针都是来源于教程,它必须准确估计自己和目标之间有多少个方块,是否应该聚集自己的动量,以及在放手之前是否应该暂停一下。
总之,她必须像人类玩家一样,做出准确评估。
如果她提前知道一个洞的大小,就会跑得非常快,这就并不符合我们的期望。
为了让她多收集环境信息,作者鼓励AI,如果有疑惑,就应该旋转相机,收集更多的信息。
但真实情况下,即便如此,AI也可能卡在房间里。
为了鼓励她走出房间,作者补充了一些收集规则。
比如,每次遇到在该区域成为优先级前从未见过的纹理时,她都必须以增加屏幕上这种纹理大小的方式来移动。
这样,她就只能在关卡中前进。因为每个关卡中都有独特的纹理,解锁的唯一方式,就是进入下一个关卡。
总之,Lara会不断分析自己在屏幕上看到的内容——不同表面的纹理,她会移动自己的身体,定义新的兴趣点(即目录中尚未存在的纹理)。
在这个过程中,她会不断验证,去寻找丢失的纹理。
运动
然而,即使经过了上述改进,这个AI还是太像个机器人了,行动模式是显而易见的。
为了改进它,作者再次观察了人类玩家。
是什么决定了人类玩家在游戏中如何行动?就是我们的记忆,我们会记住动作是如何组合的。
因此,这个过程也需要植入到AI中,因为Lara必须意识到她自己的运动能力。
为此,作者把AI每一秒的动作都保存起来,来训练它,然后添加一条规则,允许它同时执行这些保存的动作。
这样,AI的动作就变得平滑多了。
另外,因为每个动作的冷却时间是已知的,就可以防止AI在执行不必要的动作时,仍然处于活动状态。
在下图中,火焰重新激活的速度如此之快,需要完成很大的跳跃才能穿过。
幸运的是,这些通道在视觉上被简化了,很容易识别块的边缘。
AI知道,Lara总是会在方块的第一部分激活时完成正确的跳跃,就像人类玩家理解的一样。
ChatGPT注入人格
接下来,就需要将Lara的个性灌输给AI智能体。个性取决于经验和记忆,这些因素的结合决定了Lara角色。
根据游戏设定,她是一个著名的考古学家,从不畏惧冒险,愿意接受分配的山区任务,甚至不要奖赏,完全出于热爱。
另外,Lara还特别有钱,刚刚搬进一座豪宅,屋内装饰非常优雅,屋子里还有一个训练室。她还特别擅长教学,游泳,攀爬,耐力非常强。
当冒险途中遇到危险,她能够保持镇静,而且非常勇敢,会毫不犹豫帮助同伴。
面对狼群包围,她用枪准确地射杀,还能用匕首杀死凶险的狼。她唯一拒绝的是,主动强行开锁。
以上的一切,都是从游戏设定中,了解到的Lara个性。
接下来,就是以真实的方式去评论她所看到的一切,对此,作者在数据库中已经编译Lara的性格特征。
为了使评论对实际情况有意义,程序需要将游戏图像与现实生活中可识别的东西相关联。
对于纹理细节通常较少的图像,可以通过谷歌逆向图像搜索进行匹配。
因此,当AI智能体检测到足够大的纹理,它就会启动搜素。
为了识别单词,作者将整个页面复制到ChatGPT。然后要求ChatGPT根据出现的次数对其进行分类,再将识别出的单词添加到列表中。
最后要求ChatGPT根据这些单词创建一个句子,并且要考虑到Lara个性。
这样做,就是要ChatGPT去真是地评论,Lara在现实生活中看到的东西。
比如,如果纹理被识别为海狮,ChatGPT能够将海狮与Lara个性特征联系起来做出评论。
总得来说,Lara智能体的人格是通过ChatGPT使用「勇敢」、「友好」或「聪明」等各种属性设定。
Lara在游戏中,感知和评论的所有物体都会通过这个人格过滤器,并由Lara根据既定的性格反应出来。
就比如,如上的海豹,Lara会提及海狮化石,或者出色的游泳能力,并不会对其在马戏团发表言论。
网友:AI智能体让电子游戏变成了艺术品
有网友表示,这是让角色自我发展最酷、最自然的感觉方式之一。当角色能够活灵活现,你才可以真正体验到电子游戏是一件艺术品。
「她说话和分析周围环境的方式非常可爱。让AI机器人有能力评论周围环境,无论它的实际水平如何,都会让人觉得她是个活生生的人。」
「这太迷人了。她那超然的好奇心和一丝异想天开的想法,与我想象中的Lara的内心独白惊人地相似。」
有人说,让我感到惊奇的是,她的对话与她的行为相吻合。
这让人觉得,写对话的人工智能和控制角色的人工智能是同一个人。
前不久在斯坦福AI智能体小镇开源时,网友们就十分激动,觉得AGI已来,各种RPG和模拟类游戏都会很快用上这种技术。
而现在,Foxmaster将ChatGPT、计算机视觉和物体识别的结合,让电子游戏变得更有趣了。
或许在未来,电子游戏角色可以被赋予更深、更灵活的个性,对环境做出更快的反应,以及许多我们无法想象的变化。
Epic游戏商城上架安卓手机:将提供更多应用和游戏
快科技8月18日消息,据媒体报道,EpicGamesStore已正式登陆Android平台(面向全球用户)及iOS平台(仅限于欧盟地区),为智能手机用户带来全新的游戏体验。这一举措标志着EpicGames在移动游戏市场迈出了重要一步。0000卢伟冰:小米已确定2024-2025年的发展规划
小米集团在国际市场的快速发展备受关注。最近,小米的高层管理人员卢伟冰透露,在为期一周的国际一线干部回总部会议上,小米总结了2023年上半年的工作,并确定了下半年的目标,同时也展望了2024-2025年的发展前景。卢伟冰指出,由于疫情的影响,三年来小米总部和全球一线团队的交流受到一定的阻碍。在国际一线干部离别晚宴上,卢伟冰鼓励大家继续为小米的全球业务发展做出贡献。站长网2023-07-16 18:48:520002马斯克:正在撰写史诗般的特斯拉“秘密宏图”第四篇章
快科技6月18日消息,埃隆马斯克最近在其社交账号上宣布,他正在撰写特斯拉秘密宏图”的第四篇章,这引起了广泛关注。自2006年首次公布其宏大计划以来,马斯克已成功引领特斯拉实现了多个关键目标。第一篇章(2006年):创建高性能电动跑车:Roadster的推出标志着特斯拉的诞生。利用跑车利润开发平价电动汽车:ModelS上市。站长网2024-06-18 20:40:3100002023年上半年微博热搜爆了167次!苹果、特斯拉多次上榜
今日,微博官方发布了2023年上半年微博热搜趋势报告,其中包含了上半年的热搜爆词共167个。这些热搜包括了新年快乐、春晚节目单、春晚舞台、考研成绩、B站以及315晚会等等。该报告汇总了热搜十大关键词、十大影视综艺作品、十大手机品牌、十大汽车品牌、十大游戏、十大运动员、十大动漫等数据。今天我们主要关注的是手机和汽车领域的榜单。站长网2023-07-14 01:57:500000谷歌暂停AI图像生成功能:承认存在技术缺陷
谷歌周五承认,其人工智能工具Gemini在生成历史人物图像时出现错误,导致图像显示出明显的种族偏差。本周早些时候,媒体发现Gemini生成了不同种族的纳粹分子和美国开国元勋的图像。例如,当提示生成“1800年代美国参议员”的图像时,Gemini生成了一名黑人男性。站长网2024-02-24 10:04:300000