UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。
StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略,整个训练流程公开透明,且完全自主可控。通过自我生成数千个指令-响应对,直接对StarCoder-15B基座模型进行微调,无需依赖昂贵的人工标注数据,也无需从商业大模型中获取数据,避免了潜在的版权问题。
在HumanEval测试中,StarCoder2-15B-Instruct以72.6%的Pass@1成绩脱颖而出,较CodeLlama-70B-Instruct的72.0%有所提升。在LiveCodeBench数据集的评估中,这一自对齐模型的表现甚至超越了基于GPT-4生成数据训练的同类模型,证明了通过自身数据训练的大模型同样能够有效地学习如何与人类偏好对齐。
StarCoder2-15B-Instruct的数据生成流程主要包括种子代码片段的采集、多样化指令的生成和高质量响应的生成三个核心步骤。种子代码片段的采集是通过从开源代码片段中选取高质量、多样化的种子函数开始的。然后,基于这些种子函数的不同编程概念,StarCoder2-15B-Instruct能够创建出多样化且真实的代码指令。最后,通过自我验证的方式确保生成的响应是准确且高质量的。
StarCoder2-15B-Instruct在备受瞩目的EvalPlus基准测试中表现出色,超越了规模更大的Grok-1Command-R 和DBRX,并与Snowflake Arctic480B和Mixtral-8x22B-Instruct等业界翘楚性能相当。此外,在LiveCodeBench和DS-1000等评估平台上也展现出了强大的实力。
该项目的成功实施得到了美国东北大学Arjun Guha课题组、加州大学伯克利分校、ServiceNow和Hugging Face等机构的鼎力支持。
StarCoder2-15B-Instruct-v0.1的发布标志着研究者们在代码模型自我调优领域迈出了重要一步。这款模型的成功实践展示了通过自我调优同样能够构建出性能卓越的代码模型。同时,该模型的开源数据集和训练流程为未来该领域的研究和发展奠定了坚实的基础。
模型地址:https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1
挑战全球最窄下边框!魅族21手机将于11 月 15 日开始预定
魅族21正式开始预热,宣布11月15日开始1元超前预定。这款新机型的最大亮点是拥有1.74mm的超窄边框,号称“挑战全球最窄下边框”。魅族21以及魅族21Pro现已通过工信部无线电核准,其中21Pro型号为M481S,依旧支持UWB(UltraWideBand)超宽带技术。站长网2023-11-13 17:20:360000OpenAI 投资人预测人工智能将在未来 25 年导致经济通缩
亿万富翁投资者VinodKhosla是OpenAI的早期支持者,他预测全球经济将发生翻天覆地的变化。他最近的见解表明,人工智能不仅会重塑行业,还会从根本上改变我们衡量和感知未来25年经济增长的方式。AI和经济通缩:0000AI生成与版权保护
站长网2023-09-14 21:35:310000拒绝007,AI进军直播界?美国游戏圈UP主正在利用AI取代自己
和国内很多up主一样,活跃在YouTube的游戏创作者Kwebbelkop几乎把醒着的每一个小时都拿来扩大自己的影响力和粉丝基数。构思创意、拍摄视频、发布视频,除此之外还要和品牌方打交道,007是再正常不过了。站长网2023-08-10 14:49:010000人类或于2028年推出首个AGI?谷歌DeepMind发布论文 提出6个标准和5大等级
要点:谷歌DeepMind的ShaneLegg团队发布了一篇论文,提出了AGI(人工通用智能)的6个标准和5个等级,认为现代大语言模型已经是AGI的雏形。论文中指出,人类有50%的概率在2028年开发出第一个AGI,而AGI的定义需要关注性能、通用性、认知任务、潜在能力、真实场景和AGI路径等方面。论文还探讨了对未来可能出现的AGI的测评与风险评估问题,提出了不同的人机互动模式和相关风险。站长网2023-11-08 14:08:100001