微软研究员推LoRAShear技术:高效对大语言模型结构化剪枝
划重点:
- 🚀 LoRAShear:一种高效的LLMs结构化剪枝与知识恢复方法。
- 🧠 LLMs:快速处理文本数据,助力搜索引擎和问答系统。
- 💡 知识更新:微软研究人员提出结构剪枝方法,提高知识保存率。
微软的研究人员近日推出了一项名为LoRAShear的创新技术,旨在剪枝大型语言模型(LLMs)并实现知识的高效恢复。LLMs在处理文本数据和迅速检索相关信息方面表现出色,广泛应用于搜索引擎和问答系统。这项技术的问世将有望帮助用户更轻松地找到所需信息,极大地促进了人工智能的发展。
在LLMs的日常维护工作中,知识的更新和恢复是至关重要的任务之一。目前,一种常见的知识更新方法是通过精细调整(fine-tuning)。开发人员可以取得一个预训练的模型,然后在特定数据集上进行精细调整,从而更新其知识。这使得模型能够了解最新事件或特定领域的信息,为研究人员和专业人士提供了有力的工具。
微软的研究人员在这一领域取得了新的突破,他们开发了LoRAShear技术,这是一种高效的LLMs剪枝与知识恢复方法。所谓的“剪枝”是指通过移除或减少神经网络架构中的某些组件或元素,从而使其更加高效、紧凑和计算要求更低。
LoRAShear采用了Lora Half-Space Projected Gradient(LHSPG)方法,实现了渐进式结构剪枝,实现知识的高效传递,同时引入了动态知识恢复阶段,使其在预训练和指导性微调的方式下执行多阶段的精细调整。
研究人员表示,LoRAShear技术可以应用于通用的LLMs,通过分析LLMs与LoRA模块的依赖图,实现结构剪枝和知识恢复。他们提出了一种独特的算法,用于创建原始LLMs和LoRA模块的依赖图,还引入了一种结构稀疏优化算法,利用LoRA模块的信息来更新权重,从而提高了知识的保存率。
LoRAPrune技术将LoRA与迭代结构剪枝相结合,实现了高效的参数微调和直接硬件加速。他们表示,这种方法在内存使用效率上非常高,仅依赖于LoRA的权重和梯度来进行剪枝标准。
研究人员通过在开源LLAMAv1上实施LoRAShear技术来证明其有效性,他们发现,20%的LLAMAv1剪枝后,性能下降了1%,而50%的剪枝模型在评估基准上保持了82%的性能。
尽管LoRAShear技术在LLMs的知识恢复方面取得了显著的进展,但仍然面临着大规模计算资源的需求和缺乏预训练和指导性微调数据集的挑战。未来的工作将集中在解决这些挑战,为人工智能领域的发展提供更多的支持。
论文网址:https://arxiv.org/abs/2310.18356
Snap AI聊天机器人涉嫌侵犯青少年隐私,英国展开调查
文章概要:1.英国信息委员会发出初步执法通知,对Snap公司的生成式AI聊天机器人提出担忧。2.调查指出Snap未能充分识别和评估"MyAI"对儿童和其他用户隐私风险,但调查结果尚不确定。3.Snap承诺与信息委员会合作,确保其风险评估程序,同时该AI机器人在发布前经过法律和隐私审查。站长网2023-10-07 12:12:580001小米捐赠2500万驰援北京河北暴雨救灾
近日,北京、河北多地出现极端降雨,引发洪涝和地质灾害,牵动着社会各界的心。今日,小米公益基金会宣布,捐赠2500万元驰援北京、河北暴雨救灾。用于保障北京、河北受灾群众的人身安全采购紧急救灾物资和救援设备,及帮助灾后重建工作。以下为小米公益基金会原文:近日,北京、河北多地出现极端降雨,引发洪涝和地质灾害,牵动着社会各界的心。站长网2023-08-02 09:23:310000AMD AI 业务展望提升,股价仍受挫
划重点:-💼AMD提高MI300人工智能加速器产品的预期收入至40亿美元以上,但股价仍下跌。-💰第一季度净收入为1.23亿美元,符合预期,但股价表现疲弱。-📉尽管数据中心业务增长强劲,但游戏业务收入下降,竞争压力加剧。站长网2024-05-02 22:47:310000天命人速来 百度地图开启《黑神话:悟空》同款导航语音预约
快科技8月21日消息,国产3A级游戏巨作《黑神话:悟空》昨日正式在全球范围内上线,迅速掀起了一股热潮。为了与这款备受期待的游戏相呼应,百度地图也特别推出了《黑神话:悟空》同款导航语音包的预约活动。用户只需在百度地图中搜索黑神话悟空”,即可轻松完成预约。一旦导航语音包正式上线,百度地图将会自动将该语音包下载到用户的设备上,让用户在日常出行中也能感受到《黑神话:悟空》的魅力。站长网2024-08-21 16:46:580000开源语音超分辨率AI模型Resemble Enhance 可有效去除噪音杂音
ResembleEnhance是一款令人印象深刻的语音处理技术,专为将嘈杂的音频转换为清晰有力的语音而设计。该模型不仅能够去除音频中的各种噪声和杂音,还能够恢复音频失真并扩展音频带宽,使得原本的声音听起来更加清晰和自然。项目地址:https://top.aibase.com/tool/resemble-enhance主要功能:站长网2024-01-16 14:46:450002