智源研究院发布LM-Cocktail模型治理策略 低成本提升模型性能
站长网2023-12-11 14:16:430阅
智源研究院最近发布了 LM-Cocktail 模型治理策略,旨在为大模型开发者提供一个低成本持续提升模型性能的方式。
该策略通过融合多个模型的优势,实现在目标任务上性能的提升,同时保持在通用任务上的强大能力。
LM-Cocktail 可以帮助开发者将多个模型的优势能力汇总起来,生成一个具备多种特长的 “多技能” 模型。通过少量样例计算加权权重,可以融合现有模型,无需重新训练。
这种策略对于缺乏目标任务标签数据或计算资源的开发者尤为有用。LM-Cocktail 的核心是将微调后的模型与多个其他模型的参数进行融合,整合多个模型的优点,提高目标任务的准确度,同时保持在其他任务上的通用能力。
目前,LM-Cocktail 已在实验中展现了良好的性能。
论文 :https://arxiv.org/abs/2311.13534
代码 :https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail
项目地址:https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail
0000
评论列表
共(0)条相关推荐
走进域名行业知名服务商——聚名科技集团
域名行业的发展史可以追溯到1985年,当时美国互联网的创始人之一、斯坦福大学计算机系教授JonPostel推出了第一个顶级域名COM、NET和ORG。站长网2023-04-26 15:10:130000四大AI视频工具“斗法” 一文教你怎么玩
AI视频工具赛道越来越卷,各种升级令人应接不暇,尤其是Gen-2、Pika1.0、StableVideoDiffusion、和MagicAnimate,它们正在成为用户最常用的视频生成产品,背后有强大的AI大模型支撑。尽管目前的视频类大模型还达不到“用文字描述一个故事就能生成一部电影”这么高能,但已经能通过一系列提示词就能创作出一段生动的视频,还发展出图生视频等强大的多模态能力。站长网2023-12-14 09:26:480000谷歌产品大更新:Bard可生成图像;文生音乐平台等5大免费功能
2月2日,谷歌在官网对生成式AI产品进行了大更新,包括类ChatGPT聊天助手Bard可以通过文本提示生成图像;全新的文生音乐平台MusicFX;新的文生图像平台ImageFX;新的文本扩写平台TextFX;在谷歌地图中增加生成式AI功能,用文本提示快速查找路线、店铺等。站长网2024-02-02 10:52:000001魔改Stable Diffusion,开源创新“单目深度估计”模型
单目深度估计一直是计算机视觉领域的难点。仅凭一张RGB图像,想要还原出场景的三维结构,在几何结构上非常不确定,必须依赖复杂的场景理解能力。即便使用更强大的深度学习模型来实现,也面临算力需求高、图像数据注释量大、泛化能力弱等缺点。0000苹果关闭圣地亚哥人工智能团队 121名员工或将失业
根据知情人士透露,苹果公司计划关闭位于圣地亚哥的一个与人工智能业务相关的团队,共计121人,导致许多员工可能面临被解雇的风险。这个名为DataOperationsAnnotations的团队被告知,他们将被迫搬迁到奥斯汀,并与同一团队的德克萨斯州部分合并。站长网2024-01-15 11:42:030001