Meta新语言模型Humpback 遵循指令能力超越LLaMa模型
站长网2023-08-17 13:49:450阅
本文概要:
1. Meta 开发了一种方法,使大型语言模型能够在不依赖人工注释或更强大的模型的情况下,迭代地提高其遵循指令的能力。
2. 该方法使用了一种名为 "指令回译(instruction backtranslation)" 的技术,通过自我增强和自我管理的两步过程来优化语言模型的表现。
3. 使用该方法,Meta 的研究人员开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果。
Meta 的研究人员开发了一种名为 "指令回译(instruction backtranslation)" 的新技术,用于提高大语言模型的指令跟踪能力。该技术可对 LLaMa 等大型语言模型进行微调以遵循指令,而无需依赖昂贵的人工注释或从 GPT-4等更强大的模型进行提炼。

这一方法包括自我增强和自我管理两个步骤。在自我增强阶段,模型从未标记的文本语料库中生成候选指令 - 响应对,并预测哪些指令会引发相应的响应。
然后,在自我管理阶段,模型对候选对进行评分和筛选,只保留得分最高的子集。通过这种迭代的自我训练过程,模型学习生成更好的指令,并能够更好地区分高质量的示例。
Metas 研究人员表明,这种方法可以带来强大的指令跟踪性能,优于之前使用相同规模的 LLaMa 模型的工作。Meta 的研究人员通过这一方法开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果,超过了其他竞争模型如 Anthropics Claude、Guanaco、LIMA 和 Falcon-Instruct 的性能。
研究人员表示,他们计划通过考虑更大的未标记语料库来进一步扩展这一方法,从而获得更好的效果。
0000
评论列表
共(0)条相关推荐
苹果为双11抢销量拼了!iPhone 16系列天猫官方旗舰店狂减1600元
快科技10月20日消息,一年一度的双11电商节已拉开大幕,各家手机厂商为了在双11期间提升销量,推出各种优惠降价活动,配合电商平台补贴,一些旗舰新机来到史低价。今日,AppleStore官方旗舰店公布天猫双11优惠,宣布10月21日晚8点现货开卖,iPhone16系列至高优惠1600元。站长网2024-10-20 13:59:500000开店成本过千万,遍布20省份,线下拼多多崛起?
“万客来是什么?没听说过。”当你和身边的大部分人聊起这家线下服装超市时,很多人会给出这样的回答。作为一家成立20多年的公司,万客来甚至没有自己的官方网站,但最近一年却在北京、长沙、济南、沈阳、重庆、武汉、合肥等超一线城市/省会城市到处开店,现在门店已经遍布全国20个省份。0000亚马逊平台涌现大量 AI 生成的虚假旅行指南
本文概要:1.AI生成的旅行指南在亚马逊上泛滥成灾,虚假声称是著名作家撰写。2.旅行指南内含通用信息,价格低廉,部分附加虚假五星级评论。3.亚马逊需要加强审核机制,以防止AI生成的欺诈产品进入市场。站长网2023-08-08 10:21:490000董宇辉粉丝“叫板”东方甄选
一场“守护”董宇辉的行为艺术正在互联网上上演。“董宇辉山西丈母娘报道”“安徽丈母娘入场”“宇辉的丈母娘来了”。12月11日晚间,高途佳品的直播间被东方甄选主播董宇辉的丈母娘们(董宇辉粉丝)给刷屏了,不少头顶“甄选团”橙色灯牌的网友涌入高途直播间“报道”,直呼“东方甄选送来的泼天富贵,你们要接住啊”。0000郭明錤:苹果可能在 2024 年斥资 47.5 亿美元购买人工智能服务器
站长之家(ChinaZ.com)10月24日消息:据苹果分析师郭明錤预测,苹果预计将在2024年投入数十亿美元用于硬件以支持其人工智能(AI)的开发。郭明錤预计,苹果将在2023年至少投入6.2亿美元用于服务器,并在2024年投入47.5亿美元用于服务器。站长网2023-10-24 23:32:390000