DeepMind新国际象棋AI系统AZdb吊打旧系统AlphaZero
站长网2023-08-26 16:14:330阅
文章概要:
1. 谷歌DeepMind开发了一个集成系统AZdb(AlphaZero Db),将多个AlphaZero代理组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。
2.AZdb代理使用行为多样性和响应多样性,创造独特下棋风格,更好适应不同对手和新局面。
3. 测试显示,AZdb解决两倍难题,ELO评分提高50分,优于旧版AlphaZero。
谷歌DeepMind开发了一个集成系统AZdb,将多个AlphaZero AI系统组合成一个“联盟”,以增强AI国际象棋能力并提高泛化能力。
DeepMind使用“行为多样性”和“响应多样性”技术,AZdb 的AI系统被训练以不同的方式下棋。根据Google Deepmind 的说法,行为多样性最大化了AI系统之间平均棋子位置的差异,而响应多样性则使AI系统面临针对不同对手的游戏。在实践中,这也意味着 AZdb 的AI系统将看到更多不同的位置,扩大分布数据的范围,这应该允许系统更好地泛化到看不见的位置。
研究人员让AZdb与旧版AlphaZero下棋,结果显示AlphaZero Db的ELO评分提高了50分,在解决困难的国际象棋谜题时成功解题数是AlphaZero的两倍。
这证明了多AI集成的优势,AZdb可以考虑更多可能性,更好地推广到未知棋局。
AlphaZero Db展现了更高的国际象棋水平和泛化能力,这是深度强化学习在游戏领域应用的一个重要进展。多样性的集成为AI的发展提供了新的思路。
0000
评论列表
共(0)条相关推荐
中国移动被指资费升级容易降级难 官方回应:降档需要专人办理
近期,国内媒体曝光了中国移动在资费降档服务上存在的问题,引发了公众关注和网友热议。用户刘先生向媒体投诉,他为了给家中老人降低手机套餐资费,不得不两次返回老家,整个过程耗费了两个月时间。期间,他甚至遭遇了一次"被升级"的情况,被推销了99元的套餐,这使他对中国移动是否存在故意阻碍用户降档的行为产生了质疑。站长网2024-07-08 15:25:360000B站“亮底牌”,靠大开环直播导流打赢双11?
平台血拼低价,双11再起波澜,B站也在暗处悄悄使劲。9月,B站推出直播带货超新星计划,为UP主对接货源,持续开放各品类的招商。一个月后,B站陆续对外发布消息,称双11期间将为电商平台导流。站长网2023-11-06 17:11:470000还要等三年,资本快吃不下马斯克的大饼了
马斯克可能的确太想“开party”了。北京时间10月11日上午11点,在全世界科技爱好者的焦急等待中,迟到一小时的马斯克乘坐一辆特斯拉Robotaxi出现在华纳兄弟工作室。随后,在这场被预告为“载入史册”的特斯拉“We,Robot”发布会上,马斯克用了20分钟讲完后,便招呼起了机器人给赶紧给大伙“跳舞倒酒”。0000美国连锁快餐品牌White Castle引入AI点单功能
本文概要:1.WhiteCastle白色城堡打算在100多个餐厅引入支持人工智能语音的语音识别技术,以加快订单处理速度并减少与人工服务员的争论。2.WhiteCastle白色城堡与语音识别公司SoundHound合作开发这项技术,承诺在一分多钟内处理订单。3.AI语音识别技术将通过扬声器与顾客互动并确认订单,顾客若对AI识别有误或不满意,仍可以与现场人员交流。站长网2023-08-03 10:45:440000GPT-4推理提升1750%!普林斯顿清华姚班校友提出全新「思维树ToT」框架,让LLM反复思考
2022年,前谷歌大脑华人科学家JasonWei在一篇思维链的开山之作中首次提出,CoT可以增强LLM的推理能力。但即便有了思维链,LLM有时也会在非常简单的问题上犯错。最近,来自普林斯顿大学和GoogleDeepMind研究人员提出了一种全新的语言模型推理框架——「思维树」(ToT)。站长网2023-05-22 17:40:320004