UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。
StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略,整个训练流程公开透明,且完全自主可控。通过自我生成数千个指令-响应对,直接对StarCoder-15B基座模型进行微调,无需依赖昂贵的人工标注数据,也无需从商业大模型中获取数据,避免了潜在的版权问题。
在HumanEval测试中,StarCoder2-15B-Instruct以72.6%的Pass@1成绩脱颖而出,较CodeLlama-70B-Instruct的72.0%有所提升。在LiveCodeBench数据集的评估中,这一自对齐模型的表现甚至超越了基于GPT-4生成数据训练的同类模型,证明了通过自身数据训练的大模型同样能够有效地学习如何与人类偏好对齐。
StarCoder2-15B-Instruct的数据生成流程主要包括种子代码片段的采集、多样化指令的生成和高质量响应的生成三个核心步骤。种子代码片段的采集是通过从开源代码片段中选取高质量、多样化的种子函数开始的。然后,基于这些种子函数的不同编程概念,StarCoder2-15B-Instruct能够创建出多样化且真实的代码指令。最后,通过自我验证的方式确保生成的响应是准确且高质量的。
StarCoder2-15B-Instruct在备受瞩目的EvalPlus基准测试中表现出色,超越了规模更大的Grok-1Command-R 和DBRX,并与Snowflake Arctic480B和Mixtral-8x22B-Instruct等业界翘楚性能相当。此外,在LiveCodeBench和DS-1000等评估平台上也展现出了强大的实力。
该项目的成功实施得到了美国东北大学Arjun Guha课题组、加州大学伯克利分校、ServiceNow和Hugging Face等机构的鼎力支持。
StarCoder2-15B-Instruct-v0.1的发布标志着研究者们在代码模型自我调优领域迈出了重要一步。这款模型的成功实践展示了通过自我调优同样能够构建出性能卓越的代码模型。同时,该模型的开源数据集和训练流程为未来该领域的研究和发展奠定了坚实的基础。
模型地址:https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1
烧钱烧脑,年轻人最怕过年送礼
距离大年初一还有几天,你回老家过年的礼物买好了吗?在外打拼了一年的年轻人,面对即将到来的春节,内心喜忧参半。开心的是,有些人已经多年没回老家过年,想念家乡、想念爸妈、想念一家人聚在一起吃顿热乎乎的饭。担心的是,近乡情怯,一想到要给爸妈和亲戚们置办礼物,颇感压力。给家人亲戚送礼,不是一件容易的事,不仅钱包被掏空,还要费劲心思,好好准备一番。站长网2024-02-06 09:41:320000脉脉训练职场AI大模型 已接入国内数个大模型测试
日前,脉脉创始人兼CEO林凡在“猎头推动人才、人才推动世界”猎头行业峰会上,发表主题为“AIGC浪潮下中高端人才发展趋势”的演讲。林凡认为,未来,职场人将与AIGC建立伙伴式工作关系,中高端人才成为开启新纪元的关键。AIGC技术将重塑求职招聘竞争格局,猎头的机遇在于更好的连接和服务,把人岗匹配等工作交给AIGC。脉脉高聘将推出全链路猎头服务平台,用AIGC技术赋能猎头行业。站长网2023-04-25 09:45:560000谷歌给员工“断网” 2000多人一下回到远古时代
凤凰网科技讯北京时间7月19日消息,谷歌公司将在周三启动一项新的试点计划,部分员工只能使用没有接入互联网的台式机。谷歌称,这么做是为了降低网络攻击风险。谷歌最初选择了2500多名员工参加这一计划,但是在收到反馈意见后,谷歌修改了试点计划,允许员工退出,并向志愿者开放这一计划。谷歌将在选定的台式机上禁用互联网,员工只能使用公司内部网络工具以及Gmail、谷歌云端硬盘等谷歌旗下网站。站长网2023-07-19 11:23:170000喜马拉雅申请AI开放平台商标
天眼查App显示,近日,上海喜马拉雅科技有限公司申请注册多个“喜马拉雅珠峰AI开放平台”商标,国际分类包括教育娱乐、通讯服务等,目前商标状态均为申请中。站长网2023-06-20 16:17:530000欧盟ChatGPT工作组首次展示了如何解开AI聊天机器人的隐私合规性
划重点:-欧盟数据保护任务组对OpenAI的ChatGPT进行了一年多的研究,就欧盟数据保护规定如何适用于该聊天机器人提出了初步结论。-任务组在法律问题上尚未达成一致意见,如OpenAI处理个人数据的合法性和公平性。站长网2024-05-28 19:16:060000