Google DeepMind 新 AI 算法 Student of Games 能在多种棋盘游戏取得胜利
站长网2023-11-24 17:26:310阅
在最新的《自然》杂志上发表的一篇论文中,研究人员展示了一种名为「游戏学习者」(Student of Games)的新算法,这一人工智能(AI)程序结合了引导式搜索、机器学习和博弈论,成功在多种棋盘游戏中取得胜利。这一成就标志着 AI 技术在策略游戏领域的又一重大进步。
与此前的 AlphaZero 算法不同,后者只能解决完全信息游戏(如国际象棋和围棋),而在像德州扑克这样的不完全信息游戏中表现不佳。「游戏学习者」则能够跨越这一障碍,实现在多种游戏中的胜利。
此项研究起初由 Google 旗下 AI 研究部门 DeepMind 的专家们进行,但随后几位团队成员于 2022 年 1 月离开 Google,并在今年 1 月 Google 解散了剩余的大部分团队成员。
Finbarr Timbers,目前在 Midjourney 研究实验室工作,同时也是该研究的作者之一,解释说:「我们的算法能够基于游戏规则进行推理。例如,它学习所有这些游戏(国际象棋、扑克、围棋或苏格兰场),仅仅通过规则,而不需要更多信息。」他继续说道:「由此,它可以确定您应该采取的行动,以及您是否获胜。」
「游戏学习者」算法通过所谓的「反事实遗憾最小化」来确定每一步的行动。Timbers 解释说:「『遗憾』意味着『如果你进行了最优玩法,你本可以做得多好,减去你实际玩得有多好』。」
研究人员使用了美国数学家约翰·纳什提出的纳什均衡决策理论作为算法训练的基础,使其在大多数情况下找到最优策略。
「游戏学习者」算法作为一款由人工智能驱动的游戏算法,在该领域展现出了巨大的竞争力。它不仅拥有坚实的理论基础,还能够随着计算资源的增加而提高性能。
0000
评论列表
共(0)条相关推荐
台积电推迟亚利桑那州工厂开工时间 称因为劳动力短缺
据theverge消息,芯片制造商台积电推迟了其在亚利桑那州凤凰城新工厂的4纳米芯片生产的开始时间到2025年,归咎于劳动力短缺。苹果公司表示,它打算最终从台积电公司(TSMC)在美国的工厂采购用于其iPhone和MacBook型号的芯片,而英伟达和AMD也承诺使用其生产能力。站长网2023-07-21 12:09:280000华为 7 月 7 日将发布直接对标 ChatGPT 的「盘古 Chat」多模态千亿级大模型
继百度的「文心一言」、商汤的「日日新SenseNova」大模型体系,以及阿里巴巴的「通义千问」等之后,华为也加入AI大模型的行列。站长网2023-06-05 19:28:270000研究人员推出深度学习模型RECAST 改进地震预测
文章概要:-研究人员推出名为RECAST的新模型,利用更大的数据集改进地震预测准确性。-RECAST模型相较当前标准模型ETAS拥有更高灵活性,可处理更大规模数据集。-研究人员在NVIDIAGPU工作站上训练该模型,以提升地震预测的状态。最近,来自加州伯克利分校、圣克鲁斯分校以及慕尼黑工业大学的研究人员发表论文,阐述了一种崭新的模型,将深度学习引入地震预测领域。站长网2023-10-08 15:09:320000对标华为昆仑!荣耀将推出巨犀玻璃面板:Magic4已提前用上
快科技5月7日消息,根据博主数码闲聊站今天放出的消息,荣耀将推出巨犀玻璃”面板,定位对标华为的昆仑玻璃。而根据博主厂长是关同学补充的消息,虽然荣耀官方没有公布巨犀玻璃”这一名称,但采用该技术的玻璃面板,已经被应用在了荣耀Magic4至臻版上。根据此前荣耀在发布会上的介绍,荣耀Magic4至臻版与荣耀Magic5至臻版两款机型,均采用了纳米微晶玻璃,在耐摔性能上能够媲美昆仑玻璃。站长网2023-05-07 16:56:320000群友在群聊发捂嘴笑表情被起诉 法院:未侵权 驳回请求
据法治网消息,近日,一场微信群聊对话引发了一场官司,原因是因为一个表情符号。江苏的张某和李某是微信群的群友,某天李某在群聊中提到张某并称其坏人,同时配上了咧嘴笑和捂嘴笑的表情符号。次日,张某以侵犯名誉权为由向法院提起诉讼,要求李某在群聊中和报刊上公开道歉并赔偿损失。法院判决认为李某的行为并未侵犯张某的名誉权,驳回了张某的诉讼请求。站长网2023-10-11 17:30:580000