人工智能击败顶级电竞选手!DeepMind推AlphaStar Unplugged 通过离线学习掌握《星际争霸 II》玩法
文章概要:
游戏成为AI评估的试金石: 游戏一直是评估人工智能系统能力的重要场所,星际争霸II作为复杂的实时战略游戏,推动了AI在复杂性应用中的发展。
离线RL方法的革命性引入: AlphaStar Unplugged通过离线RL方法,在固定数据集上进行学习,首次打败顶级职业星际争霸选手,突破了在线RL在复杂游戏中的难题。
建立复杂环境RL基准: 通过AlphaStar Unplugged,构建了一个离线RL基准,使用固定数据集、新颖评估指标和基准代理,推动了大规模离线强化学习的研究,展示了连接模拟和实际应用之间的潜力。
DeepMind的研究人员近期推出了一项具有重大意义的成果:AlphaStar Unplugged。这一创新性研究通过实现离线强化学习,成功解决了星际争霸II这一实时策略游戏的巨大挑战,在人工智能领域迈出了重要一步。
长期以来,游戏一直是评估人工智能系统能力的重要试验场。随着人工智能技术的发展,研究人员开始寻找更复杂的游戏来评估与现实世界挑战相关的智能方面。星际争霸II,作为一款具有复杂性的实时战略游戏,成为了人工智能研究的巨大挑战,同时也促使AI技术在处理复杂问题上迈出更大的一步。
项目地址:https://github.com/deepmind/alphastar
与之前在其他游戏中取得的成就相比,这次的突破是基于离线强化学习(RL)的方法,这意味着AI代理在固定数据集上进行学习,而不需要与环境实时交互。星际争霸的复杂性使得在线RL方法难以应对,但这项研究成功地克服了这个挑战。通过AlphaStar程序,AI代理不仅击败了顶级职业选手,还在游戏玩法上达到了媲美人类的水平。
这一突破的核心在于建立了一个具有挑战性的离线RL基准。通过利用星际争霸II的海量人类玩家回放数据集,代理可以在不直接与游戏环境交互的情况下进行训练和评估。这一基准通过固定数据集和明确规则,引入了新颖的评估指标,为各种方法之间的公平比较提供了平台。研究团队还提供了一系列经过调整的基准代理,作为实验的起点。
通过AlphaStar Unplugged,研究人员不仅提供了这一突破性的方法,还认识到构建有效的星际争霸II代理所需的巨大努力。他们提供了经过精心调整的行为克隆代理,为论文中介绍的所有代理提供了基础。
总体而言,DeepMind的AlphaStar Unplugged引入了一个前所未有的离线RL基准,为解决复杂问题提供了新途径。通过利用星际争霸II这个复杂环境,这项研究为强化学习中的方法改进和性能度量设定了基准,同时也强调了离线RL在模拟与实际应用之间的潜力,为复杂环境下的代理训练提供了更安全、更实际的方法。这一成果将有望推动大规模离线强化学习研究取得更大进展。
理论物理学家称聊天机器人造福社会并提高生产力
据CNN报道,理论物理学家米奇奥·卡库认为,公众对新的人工智能技术的焦虑是没有道理的。在周日与CNN的法里德·扎卡里亚的采访中,这位未来学家说,像OpenAI的ChatGPT这样的聊天机器人将有利于社会和提高生产力。但是恐惧使人们主要关注这些程序的负面影响,他称之为“华而不实的录音机”。站长网2023-08-14 11:35:450001卖货主播逃离618:去年月入3万,今年降薪离职
宇宙的尽头是直播带货,但尽头的大门,似乎正在对一些人关上。“去年618,在公司带货卖了将近70万,今年618,我已经待业在家快三个月了。”做了三年带货主播的李凤飞说道。随着直播行业快速发展,在与整个电商产业深度绑定中,主播们不断被“神话”。少则月入过万,多则年入百万,主播这个职业在过去几年里几乎成了最令人歆羡的职业之一。站长网2023-06-14 13:54:320001vivo OriginOS 4.0 暂定 10 月发布 内置AI大模型
据微博博主@数码闲聊站爆料,OriginOS4.0暂定于今年10月发布。该系统底层包含安卓13和安卓14。据透露,OriginOS4.0的各种动效流畅度将得到提升,并且将包含AI大模型、全局自由小窗、超级终端、超级进程等新特性。站长网2023-08-19 15:28:1800011199元 小米AR体感运动主机上架:12核双芯 超广角镜头
快科技9月7日消息,小米有品推出一款新品AR体感运动主机,拥有真人进幻境、好玩燃脂快和科学量化练等亮点,众筹价为1199元起,正式价格为1799元起。据了解,这款AR体感运动主机只需要连接家里的电视即可进入运动虚拟世界。在10T异构算力和AI分割算法的加持下,可以把用户从真实世界提取出来,沉浸式放入虚拟场景。0000机器人又掌握新技能:10小时学会煮咖啡
要点:一款煮咖啡机器人通过观看人类演示视频仅需10小时学会煮咖啡,并具备自主纠错功能。这款机器人来自美国公司Figure,专攻通用人形机器人,创始人BrettAdcock是一位成功的企业家。Figure公司在2022年成立,先后获得了近8000万美元的融资,发布了首款人形机器人Figure01。站长网2024-01-08 17:30:420002