StreamingLLM:让AI模型无限期平稳运行的一种方法
要点:
1. Meta、麻省理工学院 (MIT) 和卡内基梅隆大学 (CMU) 的研究人员介绍了一项名为StreamingLLM的技术,旨在解决大型语言模型(LLMs)在长时间对话中性能下降的问题。
2. StreamingLLM利用“attention sinks”(关注点汇)的概念,通过在对话的不同阶段重新引入初始标记,使LLMs能够在无限长度的文本上保持高性能。
3. 研究人员还提出了使用单个特殊标记作为“attention sink”来稳定LLMs的关注机制,从而在长时间对话中保持高性能。
Meta、麻省理工学院 (MIT) 和卡内基梅隆大学 (CMU) 的研究人员最近发表的一篇新论文介绍了一项名为StreamingLLM的创新技术,旨在解决大型语言模型(LLMs)在长时间对话中性能下降的问题。
LLMs如OpenAI的ChatGPT和Meta的Llama2在当今的人工智能领域备受关注,但它们都面临一个共同的挑战,即在与用户的对话中始终提供高质量的响应,无论对话持续多长时间或交换的对话数量如何。这是因为LLMs在训练时是基于特定长度的数据块或序列进行预训练的,一旦用户输入的标记超过了这个长度,LLM的性能就会下降,这对企业希望在开放式对话中使用LLMs来帮助客户或员工是不可接受的。
图源备注:图片由AI生成,图片授权服务商Midjourney
StreamingLLM的解决方案是利用“attention sinks”概念,这些是在对话的不同阶段重新引入初始标记,以使LLMs能够在无限长度的文本上保持高性能。
研究人员发现,LLMs在对话或训练的早期会更加关注初始标记,因为它们对所有后续标记可见,而后续标记只对有限的后续标记可见。因此,通过在对话后期重新引入一些初始标记,用户可以有效地恢复LLM的性能。这就好比通过在对话后期使用与开始对话时相同的关键词,突然使LLMs在对话后期能够提供高质量的响应。
研究人员还提出了使用单个特殊标记作为“attention sink”的方法,通过在对话的不同阶段手动或自动重新引入此标记,可以持续保持LLMs的性能。这项技术使LLMs能够在无需频繁刷新缓存的情况下,不间断地为用户提供帮助。然而,研究人员也强调了这项技术的局限性,它并不扩展LLMs的上下文窗口,也不能确保LLM会记住对话的每个时刻的内容。
综合而言,StreamingLLM技术为LLMs在长时间对话中保持高性能提供了创新的解决方案,有望在许多领域,特别是需要持续不断地与用户交互的应用中得到广泛应用。
GitHub放大招!CEO现场挑战18分钟开发小游戏,人还在台上网友已经玩到了
GitHubCEO,直播AI写代码,挑战18分钟完成一个小游戏。结果只用了不到15分钟,直接成功在线部署,这边人还在讲台上,全球网友已经能玩上了。整个项目从一片空白的新建文件夹开始。全程只需要提出需求,看AI表演,然后一键导入代码,连CtrlC、CtrlV都省了。超额完成任务,节省下来的时间还可以用来演讲,以实际行动说明了什么叫“10倍程序员”。站长网2023-05-04 15:06:520001Redmi K70 Pro推送澎湃OS 1.0.15版本升级:新增5G-A
站长之家(ChinaZ.com)6月7日消息:今日,RedmiK70Pro迎来了全新的系统升级——澎湃OS1.0.15.0.UNMCNXM版本,安装包大小适中,为386MB。此次更新不仅为用户带来了诸多实用的新功能,还标志着RedmiK70Pro正式踏入了5.5G网络时代。站长网2024-06-08 09:51:450000OpenAI 首席执行官 Sam Altman 投资新的以色列人工智能安全初创公司
以色列人工智能安全公司Apex宣布已完成700万美元的种子轮融资,此轮融资由红杉资本和IndexVentures共同领投,多位天使投资者参与,其中包括OpenAI首席执行官山姆·阿尔特曼。自2022年ChatGPT推出以来,全球各行各业的生成式AI能力都有了巨大提升。然而,AI技术的迅速采用为企业带来了一系列安全挑战,例如数据泄露或AI驱动的网络攻击。站长网2024-05-04 08:30:320000开源项目Open Glass AI:仅20美元就能把任何眼镜改装成AI眼镜
划重点:⭐️使用低于25美的现成组件,将任何眼镜改造可编程的智能眼镜⭐️可记录生活、识别物体、翻译文字等功能⭐️开源项目,提供硬件和软件南,支持自定义定制站长之家(ChinaZ.com)5月13日消息:你敢相信?现在只需20美元即可将任何眼镜变成AI智能眼镜!有开发者构建了OpenGlassAI站长网2024-05-13 15:08:000003苹果或推出AI应用商店 预计在6月的WWDC上发布
根据最新的消息,苹果计划在即将到来的WWDC2024上,向全球展示其融入AI元素的全新系统和软件。MeliusResearch的主管BenReitzes在接受CNBC的采访时透露,苹果有可能在6月的WWDC上推出一个全新的AI应用商店。这个应用商店预计会包含来自各大供应商的AI应用,为开发者和用户提供一个丰富的选择。站长网2024-03-26 10:51:060000