微软开发新型大模型压缩方法SliceGPT
SliceGPT是微软开发的一种新型的大语言模型压缩方法。通过SLICE GPT,可以在保持99%,99%,和90%零样本任务性能的同时,将LLAMA2-70B、OPT66B和Phi-2模型分别去除高达25%的模型参数(包括嵌入)。
这意味着使用SLICE GPT的模型可以在更少的GPU上运行,并且运行速度更快,无需任何额外的代码优化。在24GB的消费级GPU上,将LLAMA2-70B的总计算量减少到密集模型的64%;在40GB的A100GPU上减少到66%。
论文地址:https://arxiv.org/pdf/2401.15024.pdf
SLICE GPT的主要特点包括解决了大语言模型在存储和计算资源上的高需求问题,并提供了一种有效减轻这些资源需求的方法,同时保持或仅轻微牺牲模型性能,这对于推广大型模型的应用和降低运行成本具有重要意义。
具体来说,SLICE GPT能够减少大型语言模型的尺寸,通过在不损失显著性能的前提下,减少模型参数数量,SLICE GPT能够减少大型语言模型的尺寸。它还能提高模型在硬件上的运行效率,减少了所需的计算资源,并且能够在去除一定比例的模型参数的同时,保持模型的性能。此外,SLICE GPT不仅适用于特定的模型或架构,它的方法可以广泛应用于各种变换器网络模型。
SLICE GPT的工作原理基于一种新的后训练稀疏化方案,通过两个关键步骤来减少大型语言模型的计算和内存需求。首先是替换权重矩阵,通过将模型中的每个权重矩阵替换为一个更小的(密集的)矩阵来减少网络的嵌入维度,有效地缩减了模型的大小。
其次是维持计算不变性,SLICE GPT引入了变换器网络中的“计算不变性”概念,通过特定的变换操作,改变权重矩阵的形状,而不改变其在模型中的功能和影响,从而达到减少模型参数的目的,同时保持模型的性能。这种方法的核心优势在于,它允许模型在去除一定比例的参数后,仍然能够保持接近原始模型的性能,适用于资源受限的设备上部署大型模型,比如普通的个人电脑或者移动设备。
直播间里的AI主播,能否卷出一片新天地?
最近,直播带货行业刮起了一股AI主播的风。区别于以柳夜熙为代表的3D超写实数字人,A-soul等2D二次元数字人,直播间里的AI主播则属于2D超写实数字人,该技术以真人为基础,通过一段视频复制真人的语言、动作、表情,从而获得一个与真人相似度极高的AI主播。而在使用上也并不复杂,不需要真人时时看管,只需要一台电脑、一台桌子,即可实现24小时直播。站长网2023-05-10 14:07:590000SpringBoot 统一处理:登录校验-拦截器、异常处理、数据格式返回
本篇将要学习SpringBoot统一功能处理模块,这也是AOP的实战环节用户登录权限的校验实现接口HandlerInterceptorWebMvcConfigurer异常处理使用注解@RestControllerAdvice@ExceptionHandler数据格式返回使用注解@ControllerAdvice并且实现接口@ResponseBodyAdvice站长网2023-05-23 19:28:060000AudioSep:可以从音频剪辑中仅分离出特定的声音
AudioSep是一种AI模型,可以使用自然语言查询进行声音分离。这一创新性的模型由Audio-AGI开发,使用户能够通过简单的语言描述来分离各种声音源。站长网2023-10-27 10:48:250000github累计11.6万星!来看看几个AutoGPT优秀的用例
AutoGPT无疑是最近AI圈最流行的开源项目之一,因为它可以使语言模型自动化以自行执行更复杂的任务。Auto-GPT是由一个名为SignificantGravitas的开发者开发,基于GPT-3.5或GPT-4语言模型所构建的实验性开源应用程序,将大型语言模型(LLM)思想串在一起来自主实现任务。截止目前,AutoGPT在github上已经获得11.6万星。站长网2023-04-27 17:20:050003对话凯文·凯利:AI 会取代人的 90% 技能,并放大剩余的 10%
采访|邹欣,CSDN副总裁出品|《新程序员》编辑部5000天后,你都会做些什么?是和AI助手一起编程,还是让生活完全由AI掌控,自己坐享其成?如果到时候还要上班,是不是不再需要通勤打卡,一切都能在家里解决?科技高度发展的5000天后,自动驾驶能否完全普及,让日复一日的塞车拥堵变成了AI编排的自动化交通?站长网2023-05-08 17:43:500000