中科院和汪军团队发布大模型玩星际争霸秀到起飞

站长网2023-12-29 10:47:237阅

要点:

1、中国科学院自动化研究所与伦敦大学学院合作，将最近兴起的LLMAgent技术应用于星际争霸II的AI研究。

2、团队通过LLM理解与分析能力来提高星际AI的长期战略规划与可解释性决策。

3、在测试中，LLMagent涌现出了超越AlphaStar的危险预测和兵种转型能力，以及前期快攻、前期侦察等类人策略。

面对星际争霸II这一巨大挑战，团队开发了TextStarCraftII——一个全新的交互环境。TextStarCraftII基于python-sc2框架，将游戏中的状态信息和动作空间映射到文本空间。宏观战略动作被转化为LLMAgent能够理解并执行的具体语义动作，而微观操作则交由一套固定的规则式方法处理。LLMagent能够在全新的战场上与游戏内置的AI展开较量。

论文地址:https://arxiv.org/pdf/2312.11865.pdf

项目地址:https://github.com/histmeisah/Large-Language-Models-play-StarCraftII

在星际争霸II的战场上，进行有效决策需要及时处理大量复杂信息，进行合理的战略分析与长期规划，最终制定宏观战略决策。团队创新性地提出了「ChainofSummarization」方法。

该方法通过单帧总结和多帧总结，提高了LLM在复杂环境中的理解和决策能力。在验证ChainofSummarization方法的有效性方面，团队选择了GPT-3.5-turbo-16k作为LLM。结果表明:ChainofSummarization不仅将LLM与游戏端的交互速度提升了十倍，还显著增强了模型对游戏情境的理解及决策能力。

团队精心设计了一套复杂的提示词系统，包括游戏状态总结，状态分析，策略建议，最终决策。模型能够全面理解游戏的当前局势，分析敌我双方的策略，并提出具有战略深度的建议，最终做出多步的合理决策。这极大地提高了LLM的实时决策能力和长期规划能力，也极大提升了决策的可解释性。

中科院和汪军团队发布大模型玩星际争霸秀到起飞

0007

评论列表

共(0)条

相关推荐

站长资讯
美团直播：排头兵先行，主力军未动
折扣给得扎实，用户薅得开心，商家进度“参差不齐”。“1.5元买到了甜啦啦的冰鲜柠檬水”“6元拿下原价16元一杯的Tims鲜萃咖啡，咖啡爱好者的快活”“抢到了6份一块钱的古茗，还有1份1块钱的瑞幸美式咖啡”在刚过去的7月18日美团“神券节官方直播间”开播当日，不乏有美团用户在小红书上兴奋得分享着“战利品”。继八年前的“外卖大战”后，“个位数点外卖”的“羊毛”又重出江湖了。
站长网2023-07-21 22:05:35
0000
研究发现，GPT 和其他 AI 模型无法分析 SEC 备案文件
划重点:-📌大型语言模型在分析SEC备案文件方面存在困难，常常无法正确回答问题。-📌AI模型经常会产生虚构的数字和事实，或者拒绝回答问题。-📌AI模型的性能必须更高才能在金融等受监管行业的大公司中实际应用。
站长网站长资讯2023-12-20 15:00:47
0000
站长资讯
从14核CPU到AI游戏，浅析Arm新架构的更多细节
前段时间，我们三易生活已经给大家分析过Arm最新一代的CPU和GPU架构设计，不过当时的资料主要还是来源于官方博客文章，以及面向大众公布的相关信息。考虑到这些资料的宣传目的，它们通常并不会讲得特别详细，特别是在一些技术细节、研发背景等方面往往会比较为缺乏。这也就是为什么我们会在当时的内容中指出其中的一些性能对比的数据缺乏参数说明，甚至可能会影响到可信度的原因。
站长网2024-06-17 04:50:21
0000
站长资讯
雷军：小米13Ultra主摄采用IMX989 副摄采用三颗IMX858
就在刚刚，雷军继续分享了小米13Ultra的硬件选型过程。雷军表示，小米13Ultra主摄选了IMX989，目前移动影像最强的，索尼和小米联合研发的。确定IMX989后，副摄其实也确定了:IMX858，目前索尼移动传感器中技术最领先的。雷军表示:1.IMX858是索尼传感器唯一支持MCSS（多摄同步系统），可以实现更好的多摄一致性;
站长网2023-04-13 15:18:03
0002
站长资讯
在演员持续罢工之际，Netflix招聘AI产品经理年薪90万美元
近日，Netflix发布了一份人工智能（AI）工作职位，该职位为机器学习平台产品经理，年薪在30万到90万美元之间。这份工作职位要求AI不仅要开发新的算法来推荐节目和电影，还要用于“创造出优秀的内容”。Netflix在其网站上的另一部分还提到，该公司使用AI来优化原创电影和电视节目的制作。
站长网2023-07-26 11:47:32
0000