Meta新语言模型Humpback 遵循指令能力超越LLaMa模型

站长网2023-08-17 13:49:450阅

本文概要:

1. Meta 开发了一种方法，使大型语言模型能够在不依赖人工注释或更强大的模型的情况下，迭代地提高其遵循指令的能力。

2. 该方法使用了一种名为 "指令回译（instruction backtranslation）" 的技术，通过自我增强和自我管理的两步过程来优化语言模型的表现。

3. 使用该方法，Meta 的研究人员开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果。

Meta 的研究人员开发了一种名为 "指令回译（instruction backtranslation）" 的新技术，用于提高大语言模型的指令跟踪能力。该技术可对 LLaMa 等大型语言模型进行微调以遵循指令，而无需依赖昂贵的人工注释或从 GPT-4等更强大的模型进行提炼。

这一方法包括自我增强和自我管理两个步骤。在自我增强阶段，模型从未标记的文本语料库中生成候选指令 - 响应对，并预测哪些指令会引发相应的响应。

然后，在自我管理阶段，模型对候选对进行评分和筛选，只保留得分最高的子集。通过这种迭代的自我训练过程，模型学习生成更好的指令，并能够更好地区分高质量的示例。

Metas 研究人员表明，这种方法可以带来强大的指令跟踪性能，优于之前使用相同规模的 LLaMa 模型的工作。Meta 的研究人员通过这一方法开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果，超过了其他竞争模型如 Anthropics Claude、Guanaco、LIMA 和 Falcon-Instruct 的性能。

研究人员表示，他们计划通过考虑更大的未标记语料库来进一步扩展这一方法，从而获得更好的效果。

Meta新语言模型Humpback遵循指令能力超越LLaMa模型

0000

评论列表

共(0)条

相关推荐

站长资讯
苹果为双11抢销量拼了！iPhone 16系列天猫官方旗舰店狂减1600元
快科技10月20日消息，一年一度的双11电商节已拉开大幕，各家手机厂商为了在双11期间提升销量，推出各种优惠降价活动，配合电商平台补贴，一些旗舰新机来到史低价。今日，AppleStore官方旗舰店公布天猫双11优惠，宣布10月21日晚8点现货开卖，iPhone16系列至高优惠1600元。
站长网2024-10-20 13:59:50
0000
开店成本过千万，遍布20省份，线下拼多多崛起？
“万客来是什么?没听说过。”当你和身边的大部分人聊起这家线下服装超市时，很多人会给出这样的回答。作为一家成立20多年的公司，万客来甚至没有自己的官方网站，但最近一年却在北京、长沙、济南、沈阳、重庆、武汉、合肥等超一线城市/省会城市到处开店，现在门店已经遍布全国20个省份。
站长网站长资讯2025-01-27 11:03:11
0000
站长资讯
亚马逊平台涌现大量 AI 生成的虚假旅行指南
本文概要：1.AI生成的旅行指南在亚马逊上泛滥成灾，虚假声称是著名作家撰写。2.旅行指南内含通用信息，价格低廉，部分附加虚假五星级评论。3.亚马逊需要加强审核机制，以防止AI生成的欺诈产品进入市场。
站长网2023-08-08 10:21:49
0000
董宇辉粉丝“叫板”东方甄选
一场“守护”董宇辉的行为艺术正在互联网上上演。“董宇辉山西丈母娘报道”“安徽丈母娘入场”“宇辉的丈母娘来了”。12月11日晚间，高途佳品的直播间被东方甄选主播董宇辉的丈母娘们（董宇辉粉丝）给刷屏了，不少头顶“甄选团”橙色灯牌的网友涌入高途直播间“报道”，直呼“东方甄选送来的泼天富贵，你们要接住啊”。
站长网站长资讯2023-12-12 16:49:46
0000
站长资讯
郭明錤：苹果可能在 2024 年斥资 47.5 亿美元购买人工智能服务器
站长之家(ChinaZ.com)10月24日消息：据苹果分析师郭明錤预测，苹果预计将在2024年投入数十亿美元用于硬件以支持其人工智能（AI）的开发。郭明錤预计，苹果将在2023年至少投入6.2亿美元用于服务器，并在2024年投入47.5亿美元用于服务器。
站长网2023-10-24 23:32:39
0000