微软新工具LLMLingua-2:可将 AI 提示压缩高达80%,节省时间和成本
划重点:
🔍 微软研究发布了 LLMLingua-2,一种用于任务不可知压缩提示的模型,可以将原始长度减少高达20%,从而降低成本和延迟。
📊 LLMLingua-2通过智能压缩长提示,去除不必要的词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%。
🚀 LLMLingua-2在多个数据集上进行了评估,显示出与强基线相比的显著性能改进,并在不同 LLM 之间展现了稳健的泛化能力。
微软研究发布了名为 LLMLingua-2的模型,用于任务不可知的提示压缩。该模型通过智能地去除长提示中的不必要词语或标记,同时保留关键信息,使得提示长度可减少至原长度的20%,从而降低成本和延迟。研究团队写道:“自然语言存在冗余,信息量不尽相同。”
LLMLingua-2比其前身 LLMLingua 和类似方法快3到6倍。LLMLingua-2使用了 MeetingBank 中的示例进行训练,该数据集包含会议记录及其摘要。要对文本进行压缩,首先将原始文本输入训练好的模型。模型对每个词语进行评分,根据周围语境为其分配保留或移除的点数。然后选择具有最高保留值的词语,以创建缩短的提示。
微软研究团队在多个数据集上对 LLMLingua-2进行了评估,包括 MeetingBank、LongBench、ZeroScrolls、GSM8K 和 BBH。尽管模型规模较小,但在各种语言任务(如问答、摘要和逻辑推理)中,它始终优于原始的 LLMLingua 和选择性上下文策略。同样,相同的压缩策略对不同 LLM(从 GPT-3.5到 Mistral-7B)和语言(从英语到中文)都有效。
LLMLingua-2只需两行代码就可以实现。该模型还已集成到广泛使用的 RAG 框架 LangChain 和 LlamaIndex 中。微软提供了演示、实际应用示例以及说明提示压缩的好处和成本节省的脚本。该公司认为这是一个有前途的方法,可以通过压缩提示实现更好的泛化能力和效率。
论文地址:https://arxiv.org/abs/2403.12968
项目入口:https://top.aibase.com/tool/llmlingua-2
拯救中国市场,只能看iPhone 16了
“(中国)那里的竞争环境是世界上最具竞争力的。我以前就说过,现在情况仍然如此。”库克这话是在解释新一季财报中大中华地区收入继续下滑时说的。北京时间8月2日凌晨,苹果发布了截至2024年6月29日的2024财年第三季度(即2024年第二季度)财报,其中大中华区收入147亿美元,同比下降7%,不及分析师预期的153亿美元。更糟糕的是,在中国市场,这已经是苹果连续第四个季度遭遇营收同比下滑。站长网2024-08-03 10:41:070000狂揽10k star,微软AutoGen框架太火了,智能体聊聊天就把问题解决了
正如网友所说的,借助AutoGen,以后完成某项任务,用户只需给出需求,敲下回车,中间过程完全不用管,任务自动就完成了。一个项目,用了短短两个星期的时间,星标量从390狂增到10K,并在Discord上吸引了5000多名成员,如此爆火的项目便是微软最近发布的全新工具AutoGen。站长网2023-10-16 14:53:590001GitHub Copilot替代品!Mutable AI帮助开发者快速构建高质量代码
MutableAI是一个AI加速的软件开发平台,旨在帮助开发者快速构建高质量的代码。它提供了AI自动完成、一键生成生产级代码、按提示开发和测试生成等核心功能,大大提高了开发效率和代码质量。体验地址:https://mutable.ai/站长网2023-08-11 11:28:350002微信朋友圈烟花社交广告上线 点赞后体验全屏沉浸式烟花效果
微信广告团队推出了新的社交广告形式——朋友圈烟花社交广告,以增加品牌与用户之间的互动和情感共鸣。该广告形式通过烟花效果吸引用户的注意,并通过定制金色按钮引导用户进行点赞互动。点赞后,全屏沉浸式烟花效果会升起,营造浓厚的节日氛围。品牌可以自定义祝福内容,与用户的情感紧密连接。同时,用户可以在评论区@朋友一起观赏烟花,以社交助力的方式推动营销活动。站长网2024-01-08 17:41:070000腾讯推新技术Paint3D 给3D模型生成高清纹理
要点:腾讯推出的技术Paint3D能够根据文本或图像输入,在不具有内嵌光照信息的3D模型上生成高分辨率、无光照的多样化纹理贴图。Paint3D利用两阶段纹理生成框架,首先通过预训练2D图像生成模型获取输入的引导信息,然后在UV纹理空间上训练无光照扩散模型,生成无光照纹理,提升3D模型纹理生成效果。站长网2024-01-02 15:04:170001