Meta新语言模型Humpback 遵循指令能力超越LLaMa模型
站长网2023-08-17 13:49:450阅
本文概要:
1. Meta 开发了一种方法,使大型语言模型能够在不依赖人工注释或更强大的模型的情况下,迭代地提高其遵循指令的能力。
2. 该方法使用了一种名为 "指令回译(instruction backtranslation)" 的技术,通过自我增强和自我管理的两步过程来优化语言模型的表现。
3. 使用该方法,Meta 的研究人员开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果。
Meta 的研究人员开发了一种名为 "指令回译(instruction backtranslation)" 的新技术,用于提高大语言模型的指令跟踪能力。该技术可对 LLaMa 等大型语言模型进行微调以遵循指令,而无需依赖昂贵的人工注释或从 GPT-4等更强大的模型进行提炼。

这一方法包括自我增强和自我管理两个步骤。在自我增强阶段,模型从未标记的文本语料库中生成候选指令 - 响应对,并预测哪些指令会引发相应的响应。
然后,在自我管理阶段,模型对候选对进行评分和筛选,只保留得分最高的子集。通过这种迭代的自我训练过程,模型学习生成更好的指令,并能够更好地区分高质量的示例。
Metas 研究人员表明,这种方法可以带来强大的指令跟踪性能,优于之前使用相同规模的 LLaMa 模型的工作。Meta 的研究人员通过这一方法开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果,超过了其他竞争模型如 Anthropics Claude、Guanaco、LIMA 和 Falcon-Instruct 的性能。
研究人员表示,他们计划通过考虑更大的未标记语料库来进一步扩展这一方法,从而获得更好的效果。
0000
评论列表
共(0)条相关推荐
Rabbit R1翻车,AI手机或许才是更好的解决方案
不久前在CES2024上亮相的智能终端RabbitR1,由于首批1万台很快售罄、两周超过5万台的市场表现,曾引发了外界的众多关注。但就在日前,有提前试用了RabbitR1的用户吐槽了这款产品实际表现,认为其响应时间过慢,或并不适合AI设备的未来趋势,甚至有观点认为其完全可以被一个App所替代。站长网2024-01-30 09:09:360000Dropbox将裁员500人 并侧重整合AI部门
网络存储应用Dropbox宣布裁员约500名员工,占公司整个劳动力16%左右。削减人员数量是为了给公司AI部门释放更多资源。裁员是为了调整公司团队的技能组合,特别是在AI和早期产品开发方面。Dropbox集中了其核心和文档流程业务,并针对其产品开发团队进行了调整。站长网2023-05-12 20:29:100001对话吴欣鸿:美图AI首先追求帮用户赚到钱,应用窗口期就2年
在生成式AI浪潮中,场景玩家是易于忽视的群体,但往往又是低调中率先吃到红利的那一个。在海外,不论微软还是Adobe都是如此;在国内,美图(HK.1357)也在展现这样的趋势。作为一家曾经爆款产品频出、“美图”被名词作动词使用的公司,美图在AI浪潮里正在展现全新的气象。有模型,国内首批交出视频大模型,Sora横空出世后又率先拿出DiT架构升级更新;站长网2024-08-06 14:08:06000020年老站博客园艰难求生 呼吁用户开通会员才能活下去
自2022年以来,中国知名技术博客网站博客园面临巨大生存危机。今年4月,博客园曾发出“绝境求商”的呼声,但随后几个月的时间里,博客园仅仅依靠用户捐助、天使投资和少量会员费用苦苦支撑。现在,博客园的存亡已陷入绝境。博客园日前官方发文《弹尽粮绝,会员救园:会员上线,命悬一线》。站长网2023-09-18 09:50:580000比亚迪入选《时代周刊》“最具影响力100家企业”榜单:世界上最重要的车企
快科技6月23日消息,美国《时代周刊》(TIME)近日公布了第三届2023年全球最具影响力100家公司榜单,评选出最有影响力的100家企业”(2023TIME100MostInfluentialCompanies),比亚迪再次成功入选,并且是连续三年登上该榜单。站长网2023-06-24 14:17:040000