微软开源 SliceGPT:大模型体量压缩25%左右,性能保持不变
站长网2024-02-11 13:33:320阅
划重点:
⭐️ 可将大模型体量压缩25% 左右,性能保持不变。
⭐️ SliceGPT 利用计算不变性简化和压缩模型。
⭐️ 切片操作后的模型可以在消费级显卡上运行,无需额外代码优化。
微软和苏黎世联邦理工学院的研究人员联合开源了 SliceGPT,该技术可以极限压缩大模型的权重矩阵,将模型体量压缩25% 左右,同时保持性能不变。实验数据显示,在保持零样本任务性能的情况下,SliceGPT 成功应用于多个大型模型,如 LLAMA-270B、OPT66B 和 Phi-2。

SliceGPT 的核心技术在于利用计算不变性来简化和压缩模型。通过对每个权重矩阵应用正交矩阵变换,SliceGPT 实现了对模型的极限压缩。此外,切片操作后的模型可以直接在消费级显卡上运行,如 N 卡的4090、4080,无需进行额外的代码优化,使得部署更加便捷。
在实验中,研究人员发现 SliceGPT 的切片技术非常简单高效,可以在几个小时内使用单个 GPU 完成模型压缩,无需复杂的细调过程。切片操作后的模型保持了高质量的生成任务性能,同时吞吐量得到提升,整体效果令人满意。
SliceGPT 的开源为压缩大模型提供了一种新颖且有效的途径,将大幅节省部署资源同时保持模型性能不变。这一技术的推出,有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。
开源地址:https://github.com/microsoft/TransformerCompression
论文地址:https://arxiv.org/abs/2401.15024
0000
评论列表
共(0)条相关推荐
AI视野:Stability AI发布大模型Stable Beluga;美图推数字人生成工具DreamAvatar;谷歌DeepMind推水印工具SynthID
StabilityAI发布开源大语言模型StableBelugaStabilityAI发布开源大语言模型StableBeluga,并基于它开发StableChat聊天机器人,采用解释微调技术进行优化,允许用户通过网页界面使用并反馈,以改进模型性能。体验地址:https://research.stability.ai/chat要点:站长网2023-08-30 15:57:140001Redmi K70入网 支持90W有线闪充
近日,型号为2311DRK48C的Redmi新机已获得入网许可,这款新机是即将发布的RedmiK70,支持90W有线闪充。据悉,RedmiK70系列将同时推出标准版和Pro版两款机型。在核心配置上,RedmiK70标准版将采用国产2K柔性直屏,升级发光材料,搭载高通骁龙8Gen2移动平台,这是今年高通主打的旗舰平台,性能强悍。站长网2023-10-11 17:09:380000电影市场冰火两重天:票房爆火创纪录,投资断档跌入谷底
2023年暑期档电影,不断带来惊喜。先是悬疑犯罪类型电影《消失的她》票房一路领先,突破35亿,再是《八角笼中》、《长安三万里》口碑持续发酵,相继跻身暑期票房榜前三。《封神》十年磨一剑,被寄予厚望。进入8月,暑期档尾声,市场又迎来电影黑马,《孤注一掷》正式上映5天,票房便达到12.92亿元。灯塔专业版票房预测显示,《孤注一掷》最终票房有望超越《消失的她》达到40亿元。站长网2023-08-13 09:26:100000百度智能云大模型平台即将推出 目前正在内测中
4月26日,百度与福州市签署战略协议,双方计划共同建设大模型在数字政府、智慧城市方面的应用,未来,双方将基于文心一言为代表的大模型和百度智能云的通用AI能力展开深入合作。双方还将共同建设百度智能云(福州)智算中心。据了解,百度文心一言自3月16日发布以来快速迭代,目前已完成4次技术版本升级,大模型推理成本降为原来的十分之一。站长网2023-05-12 20:33:390000谷歌DeepMind联合创始人:生成式AI只是一个阶段 未来发展方向是交互式AI
文章概要:1.谷歌DeepMind联合创始人穆斯塔法·苏莱曼表示,生成式人工智能(AI)只是一个阶段,未来的发展方向是交互式AI。2.他认为交互式AI将能够执行用户指定的任务,调用其他软件和人员完成工作,具备更高的动态性。3.苏莱曼预测未来五年内每个人都将拥有AI助手,他的新公司InflectionAI已经推出了聊天机器人Pi,与ChatGPT竞争,侧重于提供个人建议和对话交流。站长网2023-09-18 14:53:430003