微软研究人员推出WaveCoder：增强指令调优与精炼数据生成

站长网2024-01-02 10:24:240阅

划重点:

1. WaveCoder模型通过广泛而多才的增强指令调优，在不同的代码相关任务上表现出色。

2. 引入CodeOcean数据集，包含4个通用代码相关任务的20，000个指令实例，旨在增强指令调优的效果并提高模型的泛化能力。

3. 提出了基于LLM的生成器-鉴别器数据处理框架，通过对开源代码的分类生成多样、高质量的指令数据。

近期的研究表明，通过在高质量指令数据集上进行微调，生成的模型可以在广泛的任务上展现出色的能力。然而，现有的指令数据生成方法通常会产生重复数据，并且在数据质量上不够可控。

微软研究人员最新研究通过将指令数据分类为4个与代码相关的任务，并提出了基于LLM的生成器-鉴别器数据处理框架，从开源代码中生成多样、高质量的指令数据，从而扩展了指令调优的泛化能力。

为了验证这一方法，研究人员引入了CodeOcean数据集，其中包含20，000个指令实例，涵盖了4个通用的代码相关任务，旨在增强指令调优的效果并提高模型的泛化能力。随后，研究人员提出了WaveCoder模型，这是一个经过广泛而多才的指令调优的Code LLM，专为增强指令调优而设计。实验证明，WaveCoder模型在相同微调规模下在不同的代码相关任务上优于其他开源模型，并在以往的代码生成任务中表现出高效性。

为了更好地生成指令数据并控制数据质量，研究中提出了基于LLM的生成器-鉴别器框架。该框架通过对开源代码进行分类生成更具多样性和高质量的指令数据。在训练过程中，通过生成和鉴别，该方法使数据生成过程更具定制性和可控性。文章详细介绍了从收集原始代码到生成指令数据再到训练模型的整个流程，强调了提出的方法在提高代码LLM性能方面的重要贡献。

该研究引入了多任务指令数据方法、CodeOcean 和 WaveCoder 模型来增强 Code LLM 的泛化能力。所提出的 LLM 生成器-鉴别器框架被证明可以有效生成真实的、多样化的指令数据，有助于提高各种代码相关任务的性能。未来的工作可能会探索不同任务和更大数据集之间的相互作用，以进一步增强单任务性能和泛化能力。

论文网址：https://arxiv.org/pdf/2312.14187.pdf

微软研究人员推出WaveCoder增强指令调优与精炼数据生成

0000

评论列表

共(0)条

相关推荐

站长资讯
德克萨斯大学开发出可拉伸电子皮肤机器人马上就要有仿真皮肤了
德克萨斯大学奥斯汀分校的研究人员开发了一种创新的可拉伸电子皮肤（e-skin），这种电子皮肤赋予了机器人及其他设备与人类皮肤相似的柔软度和触觉灵敏度。这项技术突破了现有技术在材料拉伸时感应精度下降的难题，无论电子皮肤如何拉伸，其压力响应都能保持稳定，确保了精确的感知能力。图源备注：图片由AI生成，图片授权服务商Midjourney特点:
站长网2024-05-09 16:45:23
0000
站长资讯
中科院物理研究所等发布材料合成AI大语言模型MatChat
近期，中国科学院计算机网络信息中心人工智能部和物理研究所SF10组合作，通过使用来自400多万篇论文中提取的35675个无机材料固相反应合成过程，将数据处理为13878条高可信度的合成路径描述数据，并对开源大语言模型LLaMA2-7B进行微调训练，研发了专注于无机材料合成路径预测任务的大语言模型——MatChat（https://chat.aicnic.cn/onchat）。
站长网2023-11-06 08:48:48
0000
站长资讯
小红书相亲直播间，线上城市里的「小酒馆」
如果说社区是一座城市，城市中每个孤立的个体，都需要找到让自己有归属感的角落。这样的据点能加深个体对于这座城市的情感投入，不再感到漂泊无依。作者|赵铭（上海）晚上九点钟，小红书「非活勿扰」直播间又开播了。
站长网2024-03-10 17:01:40
0000
站长资讯
曝苹果研发18.8英寸巨型折叠屏：售价高昂
快科技8月7日消息，供应链人士RossYoung和郭明錤都曾爆料过，苹果正在研发两款折叠屏设备，其中一款是iPhone，一款是iPad/Mac混合体，后者拥有18.8英寸超大尺寸屏幕。最新报道指出，这款折叠屏是iPad产品，不是MacBook，理由是macOS没有对触摸屏进行优化，而且Mac用户不希望用触摸屏虚拟键盘代替实体物理按键。
站长网2024-08-07 15:15:58
0000
站长资讯
英伟达多元化供应链：人工智能芯片需求激增部分产品或交由英特尔代工
英特尔有可能成为英伟达未来GPU的制造商。英伟达CEO黄仁勋在Computex的全球媒体圆桌会议的问答环节时表示，公司正在努力多元化其芯片制造，并且最近已经获得了一款基于英特尔下一代工艺节点的测试芯片的良好测试结果。他的这番言论是在多个问题集中讨论英伟达如何确保在人工智能芯片需求激增的情况下供应，并且公司完全依赖位于台积电来制造其最先进的GPU。
站长网2023-05-31 09:23:51
0000