微软新工具LLMLingua-2:可将 AI 提示压缩高达80%,节省时间和成本
划重点:
🔍 微软研究发布了 LLMLingua-2,一种用于任务不可知压缩提示的模型,可以将原始长度减少高达20%,从而降低成本和延迟。
📊 LLMLingua-2通过智能压缩长提示,去除不必要的词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%。
🚀 LLMLingua-2在多个数据集上进行了评估,显示出与强基线相比的显著性能改进,并在不同 LLM 之间展现了稳健的泛化能力。
微软研究发布了名为 LLMLingua-2的模型,用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%,从而降低成本和延迟。研究团队写道:“自然语言存在冗余,信息量不尽相同。”
LLMLingua-2比其前身 LLMLingua 和类似方法快3到6倍。LLMLingua-2使用了 MeetingBank 中的示例进行训练,该数据集包含会议记录及其摘要。要对文本进行压缩,首先将原始文本输入训练好的模型。模型对每个词语进行评分,根据周围语境为其分配保留或移除的点数。然后选择具有最高保留值的词语,以创建缩短的提示。
微软研究团队在多个数据集上对 LLMLingua-2进行了评估,包括 MeetingBank、LongBench、ZeroScrolls、GSM8K 和 BBH。尽管模型规模较小,但在各种语言任务(如问答、摘要和逻辑推理)中,它始终优于原始的 LLMLingua 和选择性上下文策略。同样,相同的压缩策略对不同 LLM(从 GPT-3.5到 Mistral-7B)和语言(从英语到中文)都有效。
LLMLingua-2只需两行代码就可以实现。该模型还已集成到广泛使用的 RAG 框架 LangChain 和 LlamaIndex 中。微软提供了演示、实际应用示例以及说明提示压缩的好处和成本节省的脚本。该公司认为这是一个有前途的方法,可以通过压缩提示实现更好的泛化能力和效率。
论文地址:https://arxiv.org/abs/2403.12968
项目入口:https://top.aibase.com/tool/llmlingua-2
你还没搞懂 ChatGPT ,这些品牌已经用它做出好案例了
说起2023年最有可能改变世界的技术,ChatGPT必有一席之地。它在写作、绘画等领域展现出来创作能力令人惊叹,再一次掀起了“AI是否会取代人类”的讨论。刀法研究所认为,人类创造技术,是为了让技术为我们服务。ChatGPT和人类之间,不是替代关系。我们大可不必因为对未知的恐惧而抵触它,反而应该向它敞开怀抱。站长网2023-05-12 20:33:420003911定制折叠屏!荣耀与保时捷设计合作的首款产品即将发布
荣耀手机官方微博近日透露,荣耀与保时捷设计的首款合作产品正在飞驰而来。根据官方发布的预热海报,我们可以看到背景是一辆保时捷911跑车,而前景的手机虽然信息极少,但从轮廓来看是一款超薄机身,且四周圆润的产品。结合之前的爆料和产品信息,我们可以推测荣耀的首款保时捷顶级定制产品应该是基于MagicV2打造的折叠旗舰。0000字节对话类AI产品Grace内测,角逐AIGC千亿市场
6月初,Tech星球独家披露字节正在内部测试对话类AI项目,代号Grace,经过2个月的研发测试,再次有了新进展。Tech星球独家获悉,Grace已经开启测试,测试界面终于曝光,另外,测试网站也已搭建好,或为后期官网。但目前想体验Grace,需要邀请或授权的相关账号登录后,才能使用。站长网2023-08-06 10:30:100000阿里云与深圳数据交易所签署战略合作 共同探索大模型
据阿里云官方消息,近日,深圳数据交易所与阿里云签署战略合作框架协议。双方将在数据基础设施建设、数据生态、探索大模型应用等方面展开合作,进一步促进数据要素流通。根据合作框架协议,深圳数据交易所将与阿里云展开广泛合作,其中包括进一步推进数据可信流通和交易的基础设施建设,数据治理和安全合规技术合作,数据质量和资产价值评估研究,共建共享数据开发与服务生态,并探索大模型在数据要素领域的应用等。站长网2023-04-23 16:38:530004史上屏幕Apple Watch亮相:Apple Watch Series 10售价2999元起
在今日凌晨1点的苹果新品发布会上,苹果公司首次亮相了其最新智能手表——AppleWatchS10。这款手表以其全新的外观设计和有史以来最大的屏幕吸引了众多关注,屏幕尺寸甚至超过了AppleWatchUltra。站长网2024-09-11 21:14:000000