微软开发新型大模型压缩方法SliceGPT

站长网2024-01-29 17:21:360阅

SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT，可以在保持99%，99%，和90%零样本任务性能的同时，将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数（包括嵌入）。

这意味着使用SLICE GPT的模型可以在更少的GPU上运行，并且运行速度更快，无需任何额外的代码优化。在24GB的消费级GPU上，将LLAMA2-70B的总计算量减少到密集模型的64%;在40GB的A100GPU上减少到66%。

论文地址:https://arxiv.org/pdf/2401.15024.pdf

SLICE GPT的主要特点包括解决了大语言模型在存储和计算资源上的高需求问题，并提供了一种有效减轻这些资源需求的方法，同时保持或仅轻微牺牲模型性能，这对于推广大型模型的应用和降低运行成本具有重要意义。

具体来说，SLICE GPT能够减少大型语言模型的尺寸，通过在不损失显著性能的前提下，减少模型参数数量，SLICE GPT能够减少大型语言模型的尺寸。它还能提高模型在硬件上的运行效率，减少了所需的计算资源，并且能够在去除一定比例的模型参数的同时，保持模型的性能。此外，SLICE GPT不仅适用于特定的模型或架构，它的方法可以广泛应用于各种变换器网络模型。

SLICE GPT的工作原理基于一种新的后训练稀疏化方案，通过两个关键步骤来减少大型语言模型的计算和内存需求。首先是替换权重矩阵，通过将模型中的每个权重矩阵替换为一个更小的（密集的）矩阵来减少网络的嵌入维度，有效地缩减了模型的大小。

其次是维持计算不变性，SLICE GPT引入了变换器网络中的“计算不变性”概念，通过特定的变换操作，改变权重矩阵的形状，而不改变其在模型中的功能和影响，从而达到减少模型参数的目的，同时保持模型的性能。这种方法的核心优势在于，它允许模型在去除一定比例的参数后，仍然能够保持接近原始模型的性能，适用于资源受限的设备上部署大型模型，比如普通的个人电脑或者移动设备。

微软开发新型大模型压缩方法SliceGPT

0000

评论列表

共(0)条

相关推荐

站长资讯
中小企业私域碰到了大难题？不少企业积极寻求突破
中小企业私域碰到大难题了?近期在与乙方市场服务商交谈过程中，见实突然有这样的疑问。因为现在私域的乙方市场真的有点惨:一些以小程序为载体的代运营商城续约率跌近谷底。一家服务商告诉见实，他们的续约率仅有35%左右，而另一家甚至趋近于忽略不计。这一点从一些乙方企业的财报变化中也能够窥知一二。
站长网2024-06-22 23:42:17
0000
站长资讯
谷歌AI搜索功能展示更多视频和优质链接
本文概要-谷歌的人工智能搜索生成体验正在增加图像和视频功能。-视频功能对于搜索体验非常重要，谷歌已经将YouTube逐渐整合到搜索结果中。-SGE摘要中已经开始显示发布日期和图片。谷歌的人工智能搜索正在加强图像和视频功能。如果启用基于AI的SGE功能，用户可以在搜索结果顶部的彩色摘要框中看到更多的多媒体内容。
站长网2023-08-03 10:05:08
0000
站长资讯
报告揭示：71%雇主或因缺乏AI知识而落后
**划重点:**1.📈**AI需求激增:**BTG（商业人才集团）的2023技能指数报告揭示数据科学、人工智能和机器学习仍然是高需求技能，但近一年来，由于缺乏对AI的内部专业知识，大约71%的雇主在非技术工作流中使用生成式AI面临挑战。
站长网2023-11-24 18:01:48
0000
Humane 在发布 AI Pin 之前解雇了 4% 的员工
据知情人士透露，本周，Humane公司进行了裁员，解雇了公司员工的4%，此举被描述为一项削减成本的措施。一位要求匿名的知情人士表示，公司领导层最近告知员工，今年的预算将会下降。
站长网站长资讯2024-01-10 10:06:13
0000
站长资讯
Lightricks推出AI电影制作工具LTX Studio 可自动生成脚本和分镜头
要点:Lightricks推出AI制作影视工具LTXStudio，助力创作者实现故事可视化。LTXStudio是基于AI的网络工具，通过提示生成脚本和分镜头，用户可调整场景、风格和角色。Lightricks将AI应用于多个产品，致力于为专业人士提供创意工具。
站长网2024-02-29 11:42:42
0001