微软亚洲研究院提出可以将 LLM 用于工业控制 直接用GPT-4控制空调
站长网2023-08-11 17:52:261阅
微软亚洲研究院提出一种使用预训练的大型语言模型(LLM)来进行工业控制的方法。该研究通过使用 GPT-4模型来控制空气调节系统(HVAC),并且仅需少量示例样本就能达到优于传统强化学习方法的效果。传统的强化学习方法在处理异构任务、样本低效以及在线适应新场景等方面存在问题,而使用预训练 LLM 可以作为解决方案。

论文地址:https://export.arxiv.org/abs/2308.03028
该研究使用 GPT-4模型和交互环境进行实验,得到了积极的结果。研究者还进行了消融研究,以确定不同部分在控制任务中的贡献。该研究的目标是探索直接使用预训练 LLM 进行工业控制任务的潜力,以及设计解决技术债较低的工业控制任务的方法。
这篇论文的主要贡献包括:
开发了一种可将基础模型用于工业控制但无需训练的方法,其能以较低的技术债用于多种异构的任务。
研究者通过 GPT-4控制 HVAC 进行了实验,得到了积极的实验结果,展现了这些方法的潜力。
研究者进行了广泛的消融研究(涉及泛化能力、示例选取和 prompt 设计),阐明了该方向的未来发展。
0001
评论列表
共(0)条相关推荐
贝莱德:人工智能是股「巨大力量」 与一年前的元宇宙或虚拟现实不同
贝莱德公司(BlackRockInc.)正在押注人工智能(AI)热潮,抓住了人工智能带来的生产力增益的机遇。作为全球最大的资产管理公司,贝莱德公司刚刚对这一主题发表了看涨的观点。此前,经过人工智能驱动的猛烈上涨已经推动了以科技股为主的纳斯达克100指数创下有史以来上半年最佳表现。贝莱德公司指出,半导体制造商、拥有大量数据或具有高度自动化潜力的公司最有可能受益。站长网2023-06-30 22:52:3300013D产品预览应用React Native 3d Store 线上购物更立体了
ReactNative3dStore是一款先进的ReactNative应用,旨在展示带有沉浸式3D预览的产品。它为用户提供了一种创新的方式来在购物前与产品互动。通过这个应用,用户可以从各个角度探索产品,深入了解其特点和外观。站长网2023-10-30 12:20:360002抖音:严厉打击无底线炒作运动员“CP”、拉踩运动员等行为
站长之家(ChinaZ.com)8月6日消息:抖音发布《关于治理奥运会期间“饭圈”违规内容的公告》称,在近期的奥运会比赛中,平台发现仍有少数用户在站外风气带动下,转载相关言论无底线炒作运动员“CP”、拉踩运动员和教练组成员,甚至对一些运动员进行人身攻击,对此平台予以了严肃处置。站长网2024-08-06 08:36:030000辛巴称计划暂停带货去学习AI:希望找到新的发展方向
近日,辛巴在直播间中透露了辛选直播带货的实际情况,他坦诚地表示,公司的盈利情况并不像外界所想象的那样可观,甚至可以说是一年的努力最终只是“白忙一场”。为了更具体地说明这一点,辛巴还详细列举了辛选的部分开支情况。他提到,公司每年需要支付给4860名员工共计11亿多元的工资,而房租水电等日常开支也高达2亿多元。此外,为了与平台合作,辛选还需向平台支付超过20亿元的费用。站长网2024-03-14 08:56:100002微软Azure AI新增Phi、Jais等,40种新大模型
微软在官方宣布在AzureAI云开发平台中,新增了Falcon、Phi、Jais、CodeLlama、CLIP、WhisperV3、StableDiffusion等40个新模型,涵盖文本、图像、代码、语音等内容生成。开发人员只需要通过API或SDK就能快速将模型集成在应用程序中,同时支持数据微调、指令优化等量身定制功能。站长网2023-11-27 09:06:110000