中科院和汪军团队发布 大模型玩星际争霸秀到起飞
要点:
1、中国科学院自动化研究所与伦敦大学学院合作,将最近兴起的LLMAgent技术应用于星际争霸II的AI研究。
2、团队通过LLM理解与分析能力来提高星际AI的长期战略规划与可解释性决策。
3、在测试中,LLMagent涌现出了超越AlphaStar的危险预测和兵种转型能力,以及前期快攻、前期侦察等类人策略。
面对星际争霸II这一巨大挑战,团队开发了TextStarCraftII——一个全新的交互环境。TextStarCraftII基于python-sc2框架,将游戏中的状态信息和动作空间映射到文本空间。宏观战略动作被转化为LLMAgent能够理解并执行的具体语义动作,而微观操作则交由一套固定的规则式方法处理。LLMagent能够在全新的战场上与游戏内置的AI展开较量。

论文地址:https://arxiv.org/pdf/2312.11865.pdf
项目地址:https://github.com/histmeisah/Large-Language-Models-play-StarCraftII
在星际争霸II的战场上,进行有效决策需要及时处理大量复杂信息,进行合理的战略分析与长期规划,最终制定宏观战略决策。团队创新性地提出了「ChainofSummarization」方法。
该方法通过单帧总结和多帧总结,提高了LLM在复杂环境中的理解和决策能力。在验证ChainofSummarization方法的有效性方面,团队选择了GPT-3.5-turbo-16k作为LLM。结果表明:ChainofSummarization不仅将LLM与游戏端的交互速度提升了十倍,还显著增强了模型对游戏情境的理解及决策能力。
团队精心设计了一套复杂的提示词系统,包括游戏状态总结,状态分析,策略建议,最终决策。模型能够全面理解游戏的当前局势,分析敌我双方的策略,并提出具有战略深度的建议,最终做出多步的合理决策。这极大地提高了LLM的实时决策能力和长期规划能力,也极大提升了决策的可解释性。
乔布斯新书现已上线提供免费下载:众多资料首次公开
SteveJobsArchive是一个纪念苹果公司创始人SteveJobs的存档内容的组织。该组织由SteveJobs的家人和朋友于去年9月成立,旨在收藏SteveJobs的历史资料,包括一些从未公开过的资料。SteveJobsArchive网站今天发布了一本免费的电子书,其中包含了这位前苹果公司CEO的语录、电子邮件、文字记录、访谈等内容。站长网2023-04-12 11:51:490000一年产能全卖光了:消息称小米汽车锁单破10万
快科技5月9日消息,据汽车博主孙少军”爆料,小米汽车锁单量正式超过10万。小米SU7于3月28日晚上市,迄今刚超40天,上市当晚就疯狂揽收订单,27分钟内大定破5万台。在4月3日举办的小米SU7首批交付仪式上,雷军宣布,小米SU7开售仅短短几天时间,就有超过10万人下定,锁单量已超过4万单。站长网2024-05-09 16:45:210000我被《长相思》里的AI相柳,硬控了整整两小时
从周一开始,每天晚上我女朋友下班回家,我都能看到她被硬控在客厅,看剧。还给自己看的一把鼻涕一把泪,看的没事就哇哇哭。我说公司咋滴你了,天天PUA你?她说那倒没有,就是这剧太感人了。我一看剧名,《长相思》第二季。她非拉我一块看,我说我不看,这明显就不是我的菜。然后前天,在一个群里,另外一群朋友们跟打了鸡血似的,疯狂给别人安利:“《长相思》必须给我去看!”,‘’相柳太帅了啊啊啊啊啊啊!”。站长网2024-07-11 18:12:230001马斯克回应 Grok AI 在回复中引用 ChatGPT 开发商 OpenAI 的使用政策
站长之家(ChinaZ.com)12月11日消息:埃隆·马斯克(ElonMusk)最近推出了他的人工智能聊天机器人Grok,这是他的xAI公司的首个产品,使用来自X平台的实时数据进行训练。站长网2023-12-11 08:52:300000OpenAI 将 GPT-4 设置为 ChatGPT Plus 付费用户的默认模型
站长之家(ChinaZ.com)8月7日消息:OpenAI最近为ChatGPT引入了几个新功能。其中之一是加入了示例提示、建议回复和后续问题。这些新增功能旨在增强用户体验,在与AI聊天机器人对话时提供更多指导。站长网2023-08-07 09:12:390000