智源研究院发布LM-Cocktail模型治理策略低成本提升模型性能

站长网2023-12-11 14:16:430阅

智源研究院最近发布了 LM-Cocktail 模型治理策略，旨在为大模型开发者提供一个低成本持续提升模型性能的方式。

该策略通过融合多个模型的优势，实现在目标任务上性能的提升，同时保持在通用任务上的强大能力。

LM-Cocktail 可以帮助开发者将多个模型的优势能力汇总起来，生成一个具备多种特长的 “多技能” 模型。通过少量样例计算加权权重，可以融合现有模型，无需重新训练。

这种策略对于缺乏目标任务标签数据或计算资源的开发者尤为有用。LM-Cocktail 的核心是将微调后的模型与多个其他模型的参数进行融合，整合多个模型的优点，提高目标任务的准确度，同时保持在其他任务上的通用能力。

目前，LM-Cocktail 已在实验中展现了良好的性能。

论文：https://arxiv.org/abs/2311.13534

代码：https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail

项目地址：https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail

智源研究院发布LMCocktail模型治理策略低成本提升模型性能

0000

评论列表

共(0)条

相关推荐

站长资讯
企微大调群发规则：1天最多可群发31次，但每月总数被限定
于最近时候，企业微信大调了群发的规则。关键变动有二，一是调整了政务行业与教培行业的企微群发助手群发次数，让这两大行业的群发条数与其他行业保持了一致，均为平均一天一条。二是，调整后的群发管理变得更为灵活，即企业可以自行决定自己的群发频次，哪怕在一天内将一个月内所有群发数量（如一天群发30或31条）一口气用完。
站长网2024-06-01 21:16:10
0000
苹果AI研究取得重大进展 iPhone有望流畅运行复杂AI系统
据VB报道，苹果公司最近公布了两篇论文，展示了该公司在人工智能研究方面取得的重大进展。其中一项新技术有望让复杂的AI系统在iPhone、iPad等小内存设备上流畅运行。在论文中，苹果研究人员解决了一个关键挑战:如何在内存有限的设备上部署大语言模型（LLM）。
站长网站长资讯2023-12-22 11:09:56
0000
拯救销量，iPhone 16e还是太贵了
苹果最近很忙，一边和阿里、百度合作搞AI，一边发了新手机。北京时间2月20日，苹果家族新成员正式登场——不是外界之前猜测的iPhoneSE第四代，而是新系列iPhone16e。虽然名字中缺少了之前的“S”，但它算是SE系列的“接班人”，是典型的去库存产品:
站长网站长资讯2025-02-24 23:02:31
0001
站长资讯
摊牌了！视频号电商再下猛药！
“WXG（微信事业群）最亮眼的业务是视频号，基本上是全场(全公司)的希望。”这是腾讯公司创始人马化腾在去年12月22日内部员工大会上的发言内容，其中饱含着对视频号的期待。而最近，视频号又有了新动作，电商板块再下猛药!视频号新动作!克制的微信不克制了!许多人发现，微信官方悄悄地在视频号搜索顶部导航位置加入“商品”tab，并在搜索结果页新增视频号小店商品入口。
站长网2023-08-15 21:34:34
0001
站长资讯
日本制定AI准则应对过度依赖AI技术和数据偏见
🔍划重点:1.🌐日本政府制定AI准则，旨在减少过度依赖AI技术，并解决数据偏见问题。2.📜政府将在年底前敲定准则，包括10项基本原则，以确保AI公司遵循公平、透明和人权保护原则。3.🤖AI开发者、服务提供商和用户将共同承担责任，开发者需确保数据准确性和防止未经授权的访问，提供商需警告用户有关个人信息，并保证服务的有限使用。
站长网2023-10-24 23:46:57
0000