Google DeepMind 新 AI 算法 Student of Games 能在多种棋盘游戏取得胜利
站长网2023-11-24 17:26:310阅
在最新的《自然》杂志上发表的一篇论文中,研究人员展示了一种名为「游戏学习者」(Student of Games)的新算法,这一人工智能(AI)程序结合了引导式搜索、机器学习和博弈论,成功在多种棋盘游戏中取得胜利。这一成就标志着 AI 技术在策略游戏领域的又一重大进步。
与此前的 AlphaZero 算法不同,后者只能解决完全信息游戏(如国际象棋和围棋),而在像德州扑克这样的不完全信息游戏中表现不佳。「游戏学习者」则能够跨越这一障碍,实现在多种游戏中的胜利。
此项研究起初由 Google 旗下 AI 研究部门 DeepMind 的专家们进行,但随后几位团队成员于 2022 年 1 月离开 Google,并在今年 1 月 Google 解散了剩余的大部分团队成员。
Finbarr Timbers,目前在 Midjourney 研究实验室工作,同时也是该研究的作者之一,解释说:「我们的算法能够基于游戏规则进行推理。例如,它学习所有这些游戏(国际象棋、扑克、围棋或苏格兰场),仅仅通过规则,而不需要更多信息。」他继续说道:「由此,它可以确定您应该采取的行动,以及您是否获胜。」
「游戏学习者」算法通过所谓的「反事实遗憾最小化」来确定每一步的行动。Timbers 解释说:「『遗憾』意味着『如果你进行了最优玩法,你本可以做得多好,减去你实际玩得有多好』。」
研究人员使用了美国数学家约翰·纳什提出的纳什均衡决策理论作为算法训练的基础,使其在大多数情况下找到最优策略。
「游戏学习者」算法作为一款由人工智能驱动的游戏算法,在该领域展现出了巨大的竞争力。它不仅拥有坚实的理论基础,还能够随着计算资源的增加而提高性能。
0000
评论列表
共(0)条相关推荐
76%的顶级金融公司正在使用AI/ML
最近一项调查显示,目前已有76%的顶级金融公司正在使用人工智能和机器学习(AI/ML)。这些先进技术正迅速渗透多个行业部门,为提高客户满意度、运营效率和业绩带来强大动力。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-12-15 11:46:420000To C大模型,亏钱也得干
大模型的两条落地方向,虽南辕北辙但境遇相似。被寄予商业化落地厚望的是确定性较强的toB方向,只是目前看来还还击不穿成本的隔膜,定制化叙事背后的高人力、高资金成本阻碍业务向下普及,增量缓慢。而此前尚属于测试阶段的toC方向自不必说,无论是产品形态的成熟度还是用户心智深度都还不足以支撑商业化,这也是业内将聚光灯自最初的C端向B端转移的原因。站长网2023-10-06 09:36:310000GPT-4找到我女朋友的过敏原
GPT-4这位“江湖郎中”又被拉出来看病了,成功找到一小伙女朋友的过敏原。凌晨4点,他的女朋友突然全身长满大块荨麻疹,两人去了医院🏥。医生给她打了针,症状这才得到缓解。究其过敏原因,医生诊断后说过敏原可能是防腐剂/保存剂/食品化学品。这可把小伙给困惑住了,平时两人都吃得都很干净,到底是怎么回事?最后小伙询问了GPT-4,直接锁定了确切的过敏原。0000小米开启换屏/电池折扣:79.2元换电池 5折换原厂屏
快科技7月1日消息,小米今天正式开启了暑假权益活动,多款机型可以支持5折换屏幕、8折换电池等活动。共提供五重服务权益,活动时间为2023年7月1日到7月7日,感兴趣的网友可以关注一下。其中,小米/米家空调延长两年质保服务最低为53元起;小米Redmi电视延长两年质保服务最低为41元起;米家洗衣机延长两年质保服务最低为29元起;小米/米家冰箱延长两年质保服务最低为29元起步。站长网2023-07-02 10:29:34000030多款大模型将亮相2023 WAIC 文心一言、复旦MOSS等将亮相
据报道,东浩兰生会展集团董事长陈小宏在2023年世界人工智能大会(WAIC)新闻发布会上透露,本届展览将展示30多款大型人工智能模型。除了已知的通用大模型如华为盘古、阿里通义、讯飞星火、百度文心、复旦MOSS等,还将有一些垂直行业的大型模型亮相,例如商汤商量和云知声山海等对话模型,腾讯Xmusic等音乐模型。本届世界人工智能大会将于7月6日至8日在上海世博中心及世博展览馆举办。站长网2023-06-30 19:25:080000