智源研究院发布LM-Cocktail模型治理策略 低成本提升模型性能
站长网2023-12-11 14:16:430阅
智源研究院最近发布了 LM-Cocktail 模型治理策略,旨在为大模型开发者提供一个低成本持续提升模型性能的方式。
该策略通过融合多个模型的优势,实现在目标任务上性能的提升,同时保持在通用任务上的强大能力。

LM-Cocktail 可以帮助开发者将多个模型的优势能力汇总起来,生成一个具备多种特长的 “多技能” 模型。通过少量样例计算加权权重,可以融合现有模型,无需重新训练。
这种策略对于缺乏目标任务标签数据或计算资源的开发者尤为有用。LM-Cocktail 的核心是将微调后的模型与多个其他模型的参数进行融合,整合多个模型的优点,提高目标任务的准确度,同时保持在其他任务上的通用能力。
目前,LM-Cocktail 已在实验中展现了良好的性能。
论文 :https://arxiv.org/abs/2311.13534
代码 :https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail
项目地址:https://github.com/FlagOpen/FlagEmbedding/tree/master/LM_Cocktail
0000
评论列表
共(0)条相关推荐
每周AI大事件 | 国产大模型热战开启、AI监管规定来了、马斯克入局AIGC大战
欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域相关内容,帮助大家更好地了解人工智能领域的动态和发展风向。Part1动态「国内要闻」生成式人工智能服务管理办法发布其中提到利用AI生成内容应当真实准确,采取措施防止生成虚假信息;提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责等。知乎发布"知海图AI"中文大模站长网2023-04-14 09:43:010003雷军:至今还有30%的车主没试驾过就直接下单
快科技12月31日消息,在今晚的跨年直播中,雷军透露了一个引人注目的数据:目前仍有30%的车主在没有试驾的情况下直接下单购买汽车。截至目前,小米汽车的累计交付量已经超过13.5万台,并且设定了2025年的目标,计划明年交付量达到30万台。12月28日,小米汽车官方宣布,小米SU7的全年交付量已经超过13万,提前完成了全年的目标。0000别笑,你可能也分不清这些视频是不是AI的。
昨天,我和我的小伙伴们都拜倒在了一个AI视频的测试下。就是给你10个视频,让你来选这是不是AI生成的。我,一个专门做AI的自媒体,在一顿狂点之下,轻敌了,堪堪拿了60分。。。我的小伙伴,有不及格的,有70分的,但是最高的那个也才90分。痛。。太痛了。我放其中的三个视频,给大家看一下:你们可以评论区留言猜一下,谁是AI谁不是AI,反正我看的快眼花了。0000英伟达官方盘点2023年10大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界
英伟达官方盘点2023年10大研究,从CV到AI,从智能体到生成式AI。英伟达不但现实世界中用GPU收割全世界,也在虚拟世界中用一项项匪夷所思的技术展开了一场革命。2023年,是人工智能爆炸式增长的一年。红色代表人工智能,蓝色代表机器学习微软、谷歌、Meta等科技巨头纷纷回顾了这一年研究成果。英伟达虽以卖算力成为全球GPU霸主,但在AI研究方面也毫不逊色。站长网2023-12-25 17:31:140001测试显示OpenAI GPT在简历排序中存在种族偏见
**划重点:**1.🕵️♂️**实验发现:**OpenAIGPT3.5在使用虚构姓名进行简历排序时显示出对特定人种的偏见,可能影响招聘决策。2.🌐**技术应用:**企业纷纷采用生成式AI工具进行简历筛选,但《彭博》分析发现最知名的生成式AI工具存在系统性的人种偏见。站长网2024-03-08 13:36:350000