UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。
StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略,整个训练流程公开透明,且完全自主可控。通过自我生成数千个指令-响应对,直接对StarCoder-15B基座模型进行微调,无需依赖昂贵的人工标注数据,也无需从商业大模型中获取数据,避免了潜在的版权问题。

在HumanEval测试中,StarCoder2-15B-Instruct以72.6%的Pass@1成绩脱颖而出,较CodeLlama-70B-Instruct的72.0%有所提升。在LiveCodeBench数据集的评估中,这一自对齐模型的表现甚至超越了基于GPT-4生成数据训练的同类模型,证明了通过自身数据训练的大模型同样能够有效地学习如何与人类偏好对齐。
StarCoder2-15B-Instruct的数据生成流程主要包括种子代码片段的采集、多样化指令的生成和高质量响应的生成三个核心步骤。种子代码片段的采集是通过从开源代码片段中选取高质量、多样化的种子函数开始的。然后,基于这些种子函数的不同编程概念,StarCoder2-15B-Instruct能够创建出多样化且真实的代码指令。最后,通过自我验证的方式确保生成的响应是准确且高质量的。

StarCoder2-15B-Instruct在备受瞩目的EvalPlus基准测试中表现出色,超越了规模更大的Grok-1Command-R 和DBRX,并与Snowflake Arctic480B和Mixtral-8x22B-Instruct等业界翘楚性能相当。此外,在LiveCodeBench和DS-1000等评估平台上也展现出了强大的实力。
该项目的成功实施得到了美国东北大学Arjun Guha课题组、加州大学伯克利分校、ServiceNow和Hugging Face等机构的鼎力支持。
StarCoder2-15B-Instruct-v0.1的发布标志着研究者们在代码模型自我调优领域迈出了重要一步。这款模型的成功实践展示了通过自我调优同样能够构建出性能卓越的代码模型。同时,该模型的开源数据集和训练流程为未来该领域的研究和发展奠定了坚实的基础。
模型地址:https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1
MIT华人博士生将ChatGPT搬进Jupyter,自然语言编程一站式搞定
自然语言编程,在Jupyter里就能直接完成了!这款由MIT华人博士生打造的插件,实现了编程工具与GPT-4的无缝衔接。加载好之后,只要「说」出自己想要的程序,就能得到代码并直接调试运行。结合ChatGPT和Jupyter的名字,作者将其命名为Chapyter。Chapyter发布后,vscode用户投来了羡慕的目光,并期待自己有朝一日也能用上。站长网2023-07-31 18:20:230000披头士乐队的最后一首歌《Now and Then》通过先进的人工智能技术得以完整呈现
站长之家(ChinaZ.com)10月27日消息:通过WingNutFilms的机器学习技术的协助,彼得·杰克逊于2021年导演的披头士纪录片系列《TheBeatles:GetBack》得以在DisneyPlus上呈现。而同样的人工智能技术,也使得披头士乐队的最后一首歌曲得以完整呈现,很快就会与公众见面。站长网2023-10-27 11:25:350000上海发布“元宇宙”关键技术攻关行动方案
近日,上海市科学技术委员会印发《上海市“元宇宙”关键技术攻关行动方案(2023—2025年)》的通知。明确聚焦沉浸式技术、Web3技术两大主攻方向,在沉浸影音、沉浸计算、新型显示、感知交互与区块链等关键技术领域打造新高地。站长网2023-06-15 03:53:100000百度宣布AI编程工具Comate SaaS版可限时免费试用
百度宣布AI编程工具Comate限时免费试用,可以免费使用1个月,还可以通过推荐获得更多的免费试用时间,活动时间为11月11日至11月20日。邀请其他人注册,每分享1人注册成功,即可获得1个月免费试用期,总计最高获得6个月免费试用。据介绍,百度Comate是一款AI开发工具,可以帮助开发人员提高生产效率。它可以自动生成代码、注释和文档,帮助理解和修改已有代码。站长网2023-11-13 17:14:310004去除对齐和偏见,多功能文本生成模型Dolphin Mixtral 1x22b
Dolphin2.9.1Mixtral1x22b是由CognitiveComputations团队创建的一个多功能文本生成模型。这个模型具备以下特点:多功能文本生成:它能够处理指令、对话和编码任务,具有广泛的应用能力。高性能:模型基于Dolphin-2.9-Mixtral-8x22b,拥有64k上下文的基础模型,经过全权重微调,使用16k序列长度,在8xH100GPU上耗时27小时完成。站长网2024-05-24 10:20:560001