微软用AI Agent生成2500万对高质量数据,极大提升大模型性能!
随着ChatGPT、Copliot等生成式AI产品的快速迭代,对训练数据的需求呈指数级增长,同时也是提升大模型性能的关键环节之一。
为了解决训练数据短缺和质量差的难题,微软研究院发布了一个专门用于生成高质量合成数据的的AI Agent——Agent Instruct。
论文地址:https://arxiv.org/abs/2407.03502
为了突破传统合成数据的拟合性、多元化性差等,AgentInstruct使用了一种创新性方法“生成教学”(Generative Teaching),并通过多种智能体共同协作自动完成数据转换、清洗、优化从而合成高质量数据。
AgentInstruct会先收集各种原始数据种子,例如,教科书章节、网络文章、代码片段等。这些种子作为后续数据合成的基础,为模型提供了丰富的信息来源。
然后通过Content Transformation Agents智能体将原始的种子材料转换成一种中间形式,这种形式简化了后续步骤中针对具体目标创建指令的过程。
例如,一个简单的文本段落会被转换成一个论点段落、会议记录转录内容、API列表等。通过转换过程使得原本无结构的内容变得更加有条理,同时也保留了原始材料的多样性和丰富性。
在种子指令创建流程中,Instruction Creation Agents智能体会进一步处理这些经过初步转换的内容,创造出多样化的指令。
这些指令可以是要求模型执行某一特定任务的请求,例如,修改一段文字、编写一个故事、解释一个概念或是完成一个编码任务。
该阶段的目标是生成一系列具有挑战性且多样的任务,从而让模型在训练过程中接触到尽可能多的不同类型的任务。
为了进一步提指令的质量和复杂性,研究人员引入了指令细化流程,通过Refinement Agents智能体对指令进行深入的迭代优化,确保每一条指令都能够更加精准地达到预期的数据效果。
在细化的过程中,智能体首先提出各种可能的改进方案,旨在增加指令的复杂性、多样性和质量。例如,可能会提出修改指令中的某些部分,使得原本直接的问题变得更加间接,或者增加一些需要模型进行推理才能得出答案的元素。
然后再对改进后的方案进行一步优化,并且在语言表述上保持清晰和准确。智能体会仔细审核每一条建议的可行性和效果,然后以一种合理的方式整合到指令中。整个流程会反复进行迭代、优化,直到达到预期的合成数据规模和质量水平。
研究人员通过Agent Instruct自动生成了2500万个配对的高质量合成数据集,包含文本编辑、创意写作、编程、阅读理解等。然后再用生成的数据对Mistral-7b模型进行了训练、微调,开发了Orca-3模型。
在一系列基准测试中,Orca-3相比原来的Mistral-7b-Instruct的模型性能提升巨大。例如,在AGIEval上提升了40%,MMLU上提高了19%,GSM8K上进步了54%,BBH上提升了38%,AlpacaEval上提升了45%。同时,Orca-3在多项指标上也超越了LLAMA-8B-instruct和GPT-3.5-turbo等其他模型。
快手电商,找到了新活法
本周三,快手发布2023年第三季度业绩。报告期内,快手营收达279.5亿元,同比增长20.8%;经调整净利润31.7亿元,大幅超过彭博市场一致预期的26.6亿元。快手的营收主要来自在线营销、直播和电商三大板块。上季度,快手电商的表现格外突出:GMV(商品交易总额)同比增长30.4%至2902亿元,以电商为主的其他服务收入同比增长36.6%至35.4亿元,显著高于公司整体和电商行业增速。站长网2023-11-24 13:50:470000小米14 Ultra或在 2 月份登场 卢伟冰:影像非常非常非常强
根据知名博主数码闲聊站的暗示,小米即将发布的新旗舰手机小米14Ultra可能会在2月份正式登场。这一消息引起了众多消费者的关注。小米集团副总裁卢伟冰也在为小米14Ultra进行预热,他表示这款手机的影像能力将会非常非常非常强大。这一表述无疑增强了人们对小米14Ultra的期待。站长网2024-01-26 16:11:470000阿里云全面升级GPU云服务:AI大模型推理性能可提升100%
快科技7月19日消息,阿里云推出全面升级的GPU云服务,通过全新优化GPU套件,多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术,阿里云推出ACK云原生AI套件,帮助开发者及企业更高效地开发和部署AI应用,加速大模型应用落地。站长网2024-07-20 03:30:380000微软推ZeRO++新系统:减少大模型训练时间和成本
微软研究人员推出了名为ZeRO的新系统,用于优化训练大型AI模型,以应对高数据传输开销和有限带宽的难题。ZeRO建立在现有的ZeRO优化的基础上,并提供增强的通信策略,以提高训练效率,减少训练时间和成本。站长网2023-06-27 16:04:000000抖音短视频躺着做!这款视频翻译字幕配音软件不要错过
平时有在做短视频副业项目的小伙伴,肯定遇到过想要搬运剪辑国外视频,但却卡在字幕翻译的问题上。而现在,有一款工具可以解决这个问题,为用户提供简单易用的视频翻译和配音功能。体验地址:https://top.aibase.com/tool/shipinfanyipeiyin站长网2024-01-03 14:42:570001