Google DeepMind 新 AI 算法 Student of Games 能在多种棋盘游戏取得胜利
站长网2023-11-24 17:26:310阅
在最新的《自然》杂志上发表的一篇论文中,研究人员展示了一种名为「游戏学习者」(Student of Games)的新算法,这一人工智能(AI)程序结合了引导式搜索、机器学习和博弈论,成功在多种棋盘游戏中取得胜利。这一成就标志着 AI 技术在策略游戏领域的又一重大进步。

与此前的 AlphaZero 算法不同,后者只能解决完全信息游戏(如国际象棋和围棋),而在像德州扑克这样的不完全信息游戏中表现不佳。「游戏学习者」则能够跨越这一障碍,实现在多种游戏中的胜利。
此项研究起初由 Google 旗下 AI 研究部门 DeepMind 的专家们进行,但随后几位团队成员于 2022 年 1 月离开 Google,并在今年 1 月 Google 解散了剩余的大部分团队成员。
Finbarr Timbers,目前在 Midjourney 研究实验室工作,同时也是该研究的作者之一,解释说:「我们的算法能够基于游戏规则进行推理。例如,它学习所有这些游戏(国际象棋、扑克、围棋或苏格兰场),仅仅通过规则,而不需要更多信息。」他继续说道:「由此,它可以确定您应该采取的行动,以及您是否获胜。」
「游戏学习者」算法通过所谓的「反事实遗憾最小化」来确定每一步的行动。Timbers 解释说:「『遗憾』意味着『如果你进行了最优玩法,你本可以做得多好,减去你实际玩得有多好』。」
研究人员使用了美国数学家约翰·纳什提出的纳什均衡决策理论作为算法训练的基础,使其在大多数情况下找到最优策略。
「游戏学习者」算法作为一款由人工智能驱动的游戏算法,在该领域展现出了巨大的竞争力。它不仅拥有坚实的理论基础,还能够随着计算资源的增加而提高性能。
0000
评论列表
共(0)条相关推荐
独立开发变现周刊(第96期):一个课程学习网站,月收入2.6万美元
目录1、TTime:一款开源简洁截图、划词翻译软件2、Memberstack:轻松在你的网站上集成会员服务3、web-check:一站式全面了解分析网站4、ShortGPT:一款开源强大的视频创建框架5、一个后端课程学习网站,月收入2.6万美元1、TTime:一款开源简洁截图、划词翻译软件站长网2023-07-21 16:46:440000“五代手机一个样、我想用安卓”,看国外果粉如何吐槽iPhone 15?
凤凰网科技讯北京时间9月15日,苹果公司在本周发布了新一代iPhone15系列手机。然而,苹果手机的小幅升级就连果粉都感到不满。他们纷纷在社交媒体上吐槽iPhone15,认为这款新手机“令人失望”、“平淡无奇”,是在打脸果粉。站长网2023-09-15 09:12:050000淘宝今年将取消双12活动 改名“年终好价节”
淘宝宣布,今年的双12活动将不再举办,取而代之的是将于12月举办的大型活动“淘宝年终好价节”。预计将在11月底开始进行招商。今年的双12活动将于12月8日开始预热,12月10日至12日正式开始,招商报名从11月9日开始。据悉,淘宝双12活动自2012年首次推出以来,每年12月12日都会成为各电商平台推出的购物促销活动。站长网2023-11-24 14:47:030000理想汽车发布OTA 5.0版本 理想同学引入Mind GPT
在昨日的理想汽车智能软件发布会上,理想汽车宣布了一项重大更新:在他们的OTA5.0版本中,将引入自家研发的多模态认知大模型——MindGPT。MindGPT作为理想汽车完全自主研发的产品,与汽车的融合度极高,致力于让每一位乘车的家庭成员都能在车内享受到顶级的人工智能体验。虽然目前它还处在内测阶段,但其表现已经足够亮眼。站长网2023-12-11 08:27:270000零跑国际合资公司正式成立 9月起于欧洲9国开始电动汽车销售
StellantisN.V.和浙江零跑科技股份有限公司今日宣布:两家公司已通过关于成立“LeapmotorInternationalB.V.”的所有必要性审批,由Stellantis集团主导的零跑国际正式组建完成,该合资公司由Stellantis集团和零跑汽车分别持股51%和49%。站长网2024-05-14 17:52:030000