Meta新语言模型Humpback 遵循指令能力超越LLaMa模型
站长网2023-08-17 13:49:450阅
本文概要:
1. Meta 开发了一种方法,使大型语言模型能够在不依赖人工注释或更强大的模型的情况下,迭代地提高其遵循指令的能力。
2. 该方法使用了一种名为 "指令回译(instruction backtranslation)" 的技术,通过自我增强和自我管理的两步过程来优化语言模型的表现。
3. 使用该方法,Meta 的研究人员开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果。
Meta 的研究人员开发了一种名为 "指令回译(instruction backtranslation)" 的新技术,用于提高大语言模型的指令跟踪能力。该技术可对 LLaMa 等大型语言模型进行微调以遵循指令,而无需依赖昂贵的人工注释或从 GPT-4等更强大的模型进行提炼。
这一方法包括自我增强和自我管理两个步骤。在自我增强阶段,模型从未标记的文本语料库中生成候选指令 - 响应对,并预测哪些指令会引发相应的响应。
然后,在自我管理阶段,模型对候选对进行评分和筛选,只保留得分最高的子集。通过这种迭代的自我训练过程,模型学习生成更好的指令,并能够更好地区分高质量的示例。
Metas 研究人员表明,这种方法可以带来强大的指令跟踪性能,优于之前使用相同规模的 LLaMa 模型的工作。Meta 的研究人员通过这一方法开发的 Humpback65B 模型在 Alpaca 指令跟踪基准测试中取得了最先进的结果,超过了其他竞争模型如 Anthropics Claude、Guanaco、LIMA 和 Falcon-Instruct 的性能。
研究人员表示,他们计划通过考虑更大的未标记语料库来进一步扩展这一方法,从而获得更好的效果。
0000
评论列表
共(0)条相关推荐
抖音开展“风险地点”类内容专项治理 打击危险区域探险等行为
抖音发布关于开展“风险地点”类内容专项治理的公告称,当前全国已进入暑期和汛期,旅游高峰期也同时到来。为此,平台将启动为期两个月的“风险地点”专项治理行动,并在暑期结束后保持常态化治理。对发现的风险内容,平台将采取添加标注、内容下架等方式进行处理,对于高危且多次违规的账号平台也会采取账号禁言、封禁等手段治理。此次治理行动将重点关注以下内容:站长网2024-07-19 11:07:120000突发!谷歌 Python 团队全体被裁,Flutter 团队也“在劫难逃”
谷歌的好消息和坏消息,来得都很突然。本周五,谷歌母公司Alphabet公布了第1季度财报:营收为805.39亿美元,较上年同期的697.87亿美元增长15%,创2022年初以来最快增速——同样是发布财报,Meta股价暴跌15%,谷歌却由此正式跻身进入“2万亿俱乐部”!站长网2024-04-28 22:18:290000微软发布第三季度财报:生成式 AI 带来新客户 推动股价攀升
微软当时地里周二晚间公布的季度业绩给投资者留下了深刻印象,公布的收入和收益超过了华尔街的预期。该公司报告第三季度每股收益为2.45美元,超过市场普遍预期的每股2.23美元,营收为528.6亿美元,高于分析师预期的510.2亿美元。微软还为其即将到来的财季发布了强有力的指引。站长网2023-04-27 11:51:450000中关村科金发布国内首个企业知识大模型
对话式AI技术解决方案提供商“中关村科金”发布了国内首个企业知识大模型、AgentGraph应用开发平台,以及“超级员工”系列AIGC应用。企业知识大模型能够帮助企业构建、升级知识中台,提升企业知识管理和利用效能,助力业务价值创新增长。站长网2023-11-24 09:03:040000腾讯宣布打造一站式行业大模型精选商店
据新浪科技报道,今日下午,在腾讯云行业大模型及智能应用技术峰会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生宣布,腾讯云MasS将创建一站式行业大模型精选商店。据介绍,该商店将覆盖金融、文旅、政务、传媒、教育等十大行业,并提供超过50个解决方案。客户可以在这些能力模型的基础上,加入自己独有的场景数据,快速生成专属模型。站长网2023-06-20 11:54:240000