LLM-Adapters:将各种适配器集成到大型语言模型中
来自新加坡科技设计大学和新加坡管理大学的研究人员发布了一篇题为《LLM-Adapters: An Adapter Family for Parameter-Efficient Fine-Tuning of Large Language Models》的论文。该论文介绍了一种名为 LLM-Adapters 的适配器系列,用于大型语言模型的参数高效微调。该适配器系列可在不影响模型性能的情况下减少微调所需的参数数量,从而提高微调效率。
代码:https://github.com/AGI-Edgerunners/LLM-Adapters
LLM-Adapters 框架包含了最先进的开放访问大型语言模型,如 LLaMA、BLOOM、OPT 和 GPT-J,以及广泛使用的适配器,具体如下:
1、串联适配器(Series Adapter):在每个Transformer块的多头自注意力层和前馈层后串联地添加瓶颈前馈层,如图1(a)所示。
2、并行适配器(Parallel Adapter): 如图1(b)所示,将瓶颈前馈层与每个Transformer层的多头自注意力层和前馈层并行地集成。
3、LoRA:如图1(c)所示,向现有层中注入低秩可训练矩阵,实现参数高效微调。
LLM-Adapters框架设计在研究、efficient、模块化和可扩展方面表现良好,允许集成新的适配器和用新的更大规模的语言模型进行评估。
为了评估 LLM-Adapters 中的适配器的有效性,作者在6个数学推理数据集上进行了实验。实验结果表明,在简单的数学推理任务上,使用较小规模语言模型的参数高效微调仅需要很少的可训练参数,就能达到强大语言模型在零样本推断中可比的性能。总体而言,LLM-Adapters 框架提供了一个有希望的框架来微调大型语言模型用于下游任务。
核心功能:
适配器集成:将各种适配器(如 LoRA、AdapterH、AdapterP、Parallel)集成到 LLMs 中,提供灵活的模型适配能力。
参数高效微调:使用适配器进行参数高效微调,减少参数量,节省训练时间和计算资源。
支持多种任务:适用于各种 NLP 任务,如语言生成、问答、机器翻译等。
提供预训练模型:集成了 LLaMa、OPT、BLOOM 和 GPT-J 等最先进的预训练模型,可直接使用。
简化模型训练和推理:提供训练和推理代码示例,简化模型训练和推理流程。
LLM-Adapters 是一个强大的工具,可帮助用户快速搭建和优化大型语言模型,并在各种 NLP 任务上取得优秀的性能。
独家|追赶抖音快手,腾讯系多款产品加码短剧
Tech星球独家获悉,阅文将推出“奇迹短剧”平台,后续会成为阅文短剧的播放渠道。作为一款独立的短剧播放应用,奇迹短剧目前还处于内部测试阶段,不过已于去年12月通过了工信部的备案。“奇迹短剧”的备案主体,是北京天金数码科技发展有限公司,该公司也是阅文旗下天方听书网的运营主体。对于上述消息,Tech星球向阅文方面进行求证,截至发稿,对方暂无回应。站长网2024-02-27 09:19:030000GitHub Copilot让陶哲轩感到“不安”
GitHubCopilot,又一次被数学大神陶哲轩“点名”了:我发现GitHubCopilot在撰写我最近博客文章的过程中非常有帮助。它能够正确地预测那篇文章中数学论证的几个步骤。并且陶哲轩还给出了一个具体的案例做阐述。例如在上面这个例子中,陶哲轩先是将一个积分分成了三块。然后他用语言描述了如何对第一块的内容做估计,以及说明了一下如何估计剩下两块的内容。站长网2023-10-03 09:44:300000腾讯推出「银龄守护卡」卡片手机 专门为老年人设计
腾讯最近推出了一款名为「银龄守护卡」的卡片手机,专门为老年人设计。这款手机非常简约,只有四个按键,大小和工卡相似,重量不到70克。它没有一些常见的功能,如刷微博、打游戏等,但却提供了一些针对老年人需求的特殊功能。站长网2024-01-11 11:52:180000OPPO Reno 11系列手机发布 售价 2499 元起
OPPO在今天的发布会上推出了全新的Reno11Pro系列手机,其中标准版将于11月25日开售,Pro版将于12月1日开售。OPPOReno11:8256GB版本售价2499元、12256GB版本售价2799元、12512GB版本售价2999元。OPPOReno11Pro:12256GB版本售价3499元、12512GB版本售价3799元。站长网2023-11-23 15:23:570000微软华人团队发布全新基准AGIEva AI考公指日可待
微软研究人员发布了一个新的基准测试AGIEval,用于评估基础模型在人类认知任务中的表现,包括高考、公务员考试、法学院入学考试、数学竞赛和律师资格考试等。实验结果显示,GPT-4在一些任务中的表现超过了人类平均水平,但在需要复杂推理或特定领域知识的任务中不太熟练。论文链接:https://arxiv.org/pdf/2304.06364.pdf站长网2023-05-11 10:50:200000