微软开源 SliceGPT:大模型体量压缩25%左右，性能保持不变

站长网2024-02-11 13:33:320阅

划重点:

⭐️ 可将大模型体量压缩25% 左右，性能保持不变。

⭐️ SliceGPT 利用计算不变性简化和压缩模型。

⭐️ 切片操作后的模型可以在消费级显卡上运行，无需额外代码优化。

微软和苏黎世联邦理工学院的研究人员联合开源了 SliceGPT，该技术可以极限压缩大模型的权重矩阵，将模型体量压缩25% 左右，同时保持性能不变。实验数据显示，在保持零样本任务性能的情况下，SliceGPT 成功应用于多个大型模型，如 LLAMA-270B、OPT66B 和 Phi-2。

SliceGPT 的核心技术在于利用计算不变性来简化和压缩模型。通过对每个权重矩阵应用正交矩阵变换，SliceGPT 实现了对模型的极限压缩。此外，切片操作后的模型可以直接在消费级显卡上运行，如 N 卡的4090、4080，无需进行额外的代码优化，使得部署更加便捷。

在实验中，研究人员发现 SliceGPT 的切片技术非常简单高效，可以在几个小时内使用单个 GPU 完成模型压缩，无需复杂的细调过程。切片操作后的模型保持了高质量的生成任务性能，同时吞吐量得到提升，整体效果令人满意。

SliceGPT 的开源为压缩大模型提供了一种新颖且有效的途径，将大幅节省部署资源同时保持模型性能不变。这一技术的推出，有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。

开源地址:https://github.com/microsoft/TransformerCompression

论文地址:https://arxiv.org/abs/2401.15024

微软开源SliceGPT大模型体量压缩25左右 性能保持不变

0000

评论列表

共(0)条

相关推荐

站长资讯
AI视野：Stability AI发布大模型Stable Beluga；美图推数字人生成工具DreamAvatar；谷歌DeepMind推水印工具SynthID
StabilityAI发布开源大语言模型StableBelugaStabilityAI发布开源大语言模型StableBeluga，并基于它开发StableChat聊天机器人，采用解释微调技术进行优化，允许用户通过网页界面使用并反馈，以改进模型性能。体验地址:https://research.stability.ai/chat要点:
站长网2023-08-30 15:57:14
0001
站长资讯
Redmi K70入网支持90W有线闪充
近日，型号为2311DRK48C的Redmi新机已获得入网许可，这款新机是即将发布的RedmiK70，支持90W有线闪充。据悉，RedmiK70系列将同时推出标准版和Pro版两款机型。在核心配置上，RedmiK70标准版将采用国产2K柔性直屏，升级发光材料，搭载高通骁龙8Gen2移动平台，这是今年高通主打的旗舰平台，性能强悍。
站长网2023-10-11 17:09:38
0000
站长资讯
电影市场冰火两重天：票房爆火创纪录，投资断档跌入谷底
2023年暑期档电影，不断带来惊喜。先是悬疑犯罪类型电影《消失的她》票房一路领先，突破35亿，再是《八角笼中》、《长安三万里》口碑持续发酵，相继跻身暑期票房榜前三。《封神》十年磨一剑，被寄予厚望。进入8月，暑期档尾声，市场又迎来电影黑马，《孤注一掷》正式上映5天，票房便达到12.92亿元。灯塔专业版票房预测显示，《孤注一掷》最终票房有望超越《消失的她》达到40亿元。
站长网2023-08-13 09:26:10
0000
站长资讯
百度智能云大模型平台即将推出目前正在内测中
4月26日，百度与福州市签署战略协议，双方计划共同建设大模型在数字政府、智慧城市方面的应用，未来，双方将基于文心一言为代表的大模型和百度智能云的通用AI能力展开深入合作。双方还将共同建设百度智能云（福州）智算中心。据了解，百度文心一言自3月16日发布以来快速迭代，目前已完成4次技术版本升级，大模型推理成本降为原来的十分之一。
站长网2023-05-12 20:33:39
0000
站长资讯
谷歌DeepMind联合创始人：生成式AI只是一个阶段未来发展方向是交互式AI
文章概要:1.谷歌DeepMind联合创始人穆斯塔法·苏莱曼表示，生成式人工智能（AI）只是一个阶段，未来的发展方向是交互式AI。2.他认为交互式AI将能够执行用户指定的任务，调用其他软件和人员完成工作，具备更高的动态性。3.苏莱曼预测未来五年内每个人都将拥有AI助手，他的新公司InflectionAI已经推出了聊天机器人Pi，与ChatGPT竞争，侧重于提供个人建议和对话交流。
站长网2023-09-18 14:53:43
0003