20倍的压缩比例!微软发布LLMLingua:压缩长提示并加快模型推理速度
划重点:
🔍微软团队推出 LLMLingua,一种独特的粗细压缩技术,用于压缩长提示并加快模型推理速度。
🔍LLMLingua 采用动态预算控制、逐标记迭代压缩算法和指令调整方法,确保在大比例压缩下保持提示的语义完整性。
🔍实验结果表明,LLMLingua 在不同情境中都达到了最先进的性能,并能实现高达20倍的压缩比例。
微软的研究团队开发了一种名为 LLMLingua 的独特粗细压缩技术,旨在解决大型语言模型(LLMs)中长提示带来的问题。LLMs 以其强大的泛化和推理能力显著推动了人工智能(AI)领域的发展,展示了自然语言处理(NLP)、自然语言生成(NLG)、计算机视觉等方面的能力。然而,最新的发展,如上下文学习(ICL)和思维链(CoT)提示,导致了部署更长提示的需求,有时甚至超过数万个标记。这在模型推理方面带来了成本效益和计算效率的问题。
为了克服这些挑战,微软团队引入了 LLMLingua,一种独特的粗细压缩技术。LLMLingua 的主要目标是减少处理长提示的费用,并加快模型推理速度。为此,LLMLingua 采用了以下几种关键策略:
1. 预算控制器:设计了一个动态预算控制器,用于在原始提示的各个部分之间分配压缩比例。这确保了即使在大比例压缩下,提示的语义完整性也得到保留。
2. 标记级迭代压缩算法:LLMLingua 集成了一种标记级迭代压缩算法,通过捕捉压缩元素之间的相互依赖关系,实现更复杂的压缩,并保持关键提示信息。
3. 指令调整方法:团队提出了一种基于指令调整的方法,用于解决语言模型之间的分布不一致问题。调整语言模型的分布可以提高用于快速压缩的小型语言模型与预期 LLM 之间的兼容性。
团队使用来自不同情境的四个数据集进行了分析和实验,以验证 LLMLingua 的实用性。这些数据集包括推理的 GSM8K 和 BBH,对话的 ShareGPT 以及摘要的 Arxiv-March23。结果显示,该方法在每种情境下都实现了最先进的性能。结果甚至表明,LLMLingua 在牺牲很少性能的情况下允许高达20倍的压缩。
实验中使用的小型语言模型是 LLaMA-7B,闭合的 LLM 是 GPT-3.5-Turbo-0301。LLMLingua 在最大压缩比例为20倍时优于先前的压缩技术,保留了推理、摘要和话语技能,展现了弹性、经济性、高效性和可恢复性。
LLMLingua 的有效性已经在一系列闭合 LLMs 和小型语言模型中得到观察。在使用 GPT-2-small 时,LLMLingua 显示出与较大模型相当的性能结果。它还在强大的 LLMs 上表现出色,超出了预期的快速结果。
LLMLingua 的可恢复性是一个值得注意的方面,当用于恢复压缩提示时,GPT-4可以有效地从完整的九步 CoT 提示中检索重要的推理信息,保持原始提示的意义和相似性。这个功能确保了可恢复性,即使在翻译后也能保留关键信息,增加了 LLMLingua 的整体亮点。
,LLMLingua 为 LLM 应用程序中长提示所带来的困难提供了全面的解决方案。该方法表现出色,并提供了一种改善 LLM 应用程序的效果和可负担性的有用方式。
项目网址:https://github.com/microsoft/LLMLingua
论文网址:https://arxiv.org/pdf/2310.05736.pdf
博客网址:https://www.microsoft.com/en-us/research/blog/llmlingua-innovating-llm-efficiency-with-prompt-compression/
扎克伯格宣布大胆计划:将 AI 融入Meta 的每一个产品
Meta前Facebook首席执行官马克·扎克伯格(MarkZuckerberg)有一个大胆的新计划,目的是为Meta拥有的产品增加一些吸引力,也就是将在每一个产品中都加入一些生成人工智能功能。据Axios报道,在上周四的全体会议上,扎克伯格公布了一系列生成性人工智能工具和集成,这些工具将融入Meta的内部和面向消费者的产品中,包括Facebook和Instagram。站长网2023-06-12 17:12:560001小米:双11全渠道支付额破180亿
小米公司今日宣布了其双11购物节的辉煌战绩,截至2024年10月31日23:59:59,全渠道累计支付金额突破180亿元人民币,相较于去年的100亿元成绩,实现了显著增长。今年双11的促销活动提前至10月14日启动,相较于去年的10月19日,尽管开始时间更早,但小米依然取得了卓越的销售业绩。0001百度地图推出隧道车道级导航 定位不准确可申请100元赔付
百度地图全球首次推出隧道车道级导航,为重庆3000万用户解决隧道导航问题。该导航功能通过自研的“北斗高精”融合定位技术,实现了进出隧道不漂移、车标稳定跟随等特点。同时,车道级导航可以在隧道内精准定位行驶车道,并提供实时展示车道级路况和道路事件,提供安全变道指引。为了保证服务质量,百度地图推出限时100元赔付活动,用户在使用百度地图导航时如发现定位不准确可以申请错必赔保障。站长网2023-08-08 17:21:000000百度地图AI向导大升级:多个目的地一句话搞定
快科技11月25日消息,百度地图升级AI向导”功能,规划多个目的地一句话就能搞定。过去,当我们有多个目的地需要规划一条路线时,需要通过手动一条条添加途径点来解决。现在,喊一声小度小度”,告诉TA想去哪里,要路过哪里。例如说一句我想去星巴克,路上加个油”就能直接生成路线。想要体验这一功能,更新至百度地图最新版,在首页搜索【AI向导】即可。站长网2023-11-26 04:31:590000倒闭潮!一年关门12888家:曾夜夜爆满的“荷尔蒙乐园”,为何走向末路?
曾经逃课也要去的网吧,成了夕阳产业?三十年河东,三十年河西,翻云覆雨间,沧海变桑田。过去的造富风口,如今的夕阳产业,昔日夜夜爆满的网吧,如今已门可罗雀。要知道,在无数80、90后的集体记忆里,网吧不仅仅是游戏的天堂,还是窥探外面世界的窗口,更是承载青春的“荷尔蒙乐园”。0000