微软开源 SliceGPT:大模型体量压缩25%左右,性能保持不变
站长网2024-02-11 13:33:320阅
划重点:
⭐️ 可将大模型体量压缩25% 左右,性能保持不变。
⭐️ SliceGPT 利用计算不变性简化和压缩模型。
⭐️ 切片操作后的模型可以在消费级显卡上运行,无需额外代码优化。
微软和苏黎世联邦理工学院的研究人员联合开源了 SliceGPT,该技术可以极限压缩大模型的权重矩阵,将模型体量压缩25% 左右,同时保持性能不变。实验数据显示,在保持零样本任务性能的情况下,SliceGPT 成功应用于多个大型模型,如 LLAMA-270B、OPT66B 和 Phi-2。
SliceGPT 的核心技术在于利用计算不变性来简化和压缩模型。通过对每个权重矩阵应用正交矩阵变换,SliceGPT 实现了对模型的极限压缩。此外,切片操作后的模型可以直接在消费级显卡上运行,如 N 卡的4090、4080,无需进行额外的代码优化,使得部署更加便捷。
在实验中,研究人员发现 SliceGPT 的切片技术非常简单高效,可以在几个小时内使用单个 GPU 完成模型压缩,无需复杂的细调过程。切片操作后的模型保持了高质量的生成任务性能,同时吞吐量得到提升,整体效果令人满意。
SliceGPT 的开源为压缩大模型提供了一种新颖且有效的途径,将大幅节省部署资源同时保持模型性能不变。这一技术的推出,有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。
开源地址:https://github.com/microsoft/TransformerCompression
论文地址:https://arxiv.org/abs/2401.15024
0000
评论列表
共(0)条相关推荐
今日AI:已有人抢先体验GPT-5;意念操控成真!瘫痪8年小哥秒变X教授;微软也来复刻Sora;谷歌开放Gemini1.5Pro的API支持
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/📰🤖📢AI新鲜事羡慕!已有人抢先体验GPT-5性能大飞升!【AiBase提要:】⭐️OpenAI向客户提供GPT-5体验版本,红队测试进行中,夏季发布预计最快。站长网2024-03-22 10:03:380000智源研究院推出FlagEval“天秤”大模型评测体系
在今日的2023北京智源大会上,智源研究院宣布推出FlagEval(天秤)大语言模型评测体系。该体系从“能力、任务、指标”三维评测角度出发,结合超过600个维度对大模型进行全面测评。据悉,天秤大模型的任务维度目前包含22个主观和客观评测数据集,共计超过84433道评测题目。站长网2023-06-09 20:57:130000研究人员发现了针对云托管AI模型的“LLM劫持”计划
划重点:⚠️研究人员发现了一种名为“LLMjacking”的新型攻击,针对云服务上托管的大型语言模型(LLMs)。⚠️攻击者利用被盗的云凭证,针对云托管的大型语言模型服务,以将访问权限出售给其他威胁行为者。⚠️攻击手段包括利用易受攻击的Laravel框架版本入侵系统,获取亚马逊云服务凭证,进而访问LLM服务。站长网2024-05-11 06:50:590000芯片制造商KLA业绩超预期 受益于AI领域投资增加
制造芯片工具的厂商KLA公司预测,其第一季度的收入和利润都超过了华尔街的预期。该公司的业绩受益于人工智能(AI)投资的增加,因为各个行业的企业都在争相将AI工具融入其运营中。KLA公司在芯片供应链中发挥着关键作用,从AI技术的需求增长中受益。站长网2023-07-28 14:09:370000英伟达 Blackwell B100 GPU 或将采用 SK 海力士 HBM3e DRAM:因人工智能需求快速增长提前到 2024 年第二季度推出
站长之家(ChinaZ.com)10月16日消息:据报道,由于人工智能需求的大幅增加,英伟达计划将其下一代BlackwellB100GPU的发布日期从2024年第四季度提前到2024年第二季度。此外,该公司预计将使用SK海力士的HBM3eDRAM来驱动其最新的芯片。站长网2023-10-16 23:02:370000