UIUC发布StarCoder2-15B-Instruct代码大模型 无需OpenAI数据登上性能榜单
UIUC与BigCode组织的研究者们最近发布了StarCoder2-15B-Instruct代码大模型,这一创新成果在代码生成任务方面取得了显著突破。这款模型成功超越了CodeLlama-70B-Instruct,登上了代码生成性能榜单之巅。
StarCoder2-15B-Instruct的独特之处在于其纯自对齐策略,整个训练流程公开透明,且完全自主可控。通过自我生成数千个指令-响应对,直接对StarCoder-15B基座模型进行微调,无需依赖昂贵的人工标注数据,也无需从商业大模型中获取数据,避免了潜在的版权问题。
在HumanEval测试中,StarCoder2-15B-Instruct以72.6%的Pass@1成绩脱颖而出,较CodeLlama-70B-Instruct的72.0%有所提升。在LiveCodeBench数据集的评估中,这一自对齐模型的表现甚至超越了基于GPT-4生成数据训练的同类模型,证明了通过自身数据训练的大模型同样能够有效地学习如何与人类偏好对齐。
StarCoder2-15B-Instruct的数据生成流程主要包括种子代码片段的采集、多样化指令的生成和高质量响应的生成三个核心步骤。种子代码片段的采集是通过从开源代码片段中选取高质量、多样化的种子函数开始的。然后,基于这些种子函数的不同编程概念,StarCoder2-15B-Instruct能够创建出多样化且真实的代码指令。最后,通过自我验证的方式确保生成的响应是准确且高质量的。
StarCoder2-15B-Instruct在备受瞩目的EvalPlus基准测试中表现出色,超越了规模更大的Grok-1Command-R 和DBRX,并与Snowflake Arctic480B和Mixtral-8x22B-Instruct等业界翘楚性能相当。此外,在LiveCodeBench和DS-1000等评估平台上也展现出了强大的实力。
该项目的成功实施得到了美国东北大学Arjun Guha课题组、加州大学伯克利分校、ServiceNow和Hugging Face等机构的鼎力支持。
StarCoder2-15B-Instruct-v0.1的发布标志着研究者们在代码模型自我调优领域迈出了重要一步。这款模型的成功实践展示了通过自我调优同样能够构建出性能卓越的代码模型。同时,该模型的开源数据集和训练流程为未来该领域的研究和发展奠定了坚实的基础。
模型地址:https://huggingface.co/bigcode/starcoder2-15b-instruct-v0.1
钉钉 AI 魔法棒正式上线 所有功能开放测试
钉钉AI魔法棒正式上线,包含17个产品线、60多个场景和近百种AI技能,全面开放测试。用户可以通过钉钉的首页右上角的“魔法棒”入口或各个产品页面的魔法棒按钮使用钉钉AI。钉钉AI魔法棒的一大特点是统一的LUI交互入口,通过自然语言对话的方式实现各类场景和应用的交互。站长网2023-11-03 14:07:050000意大利研究人员开发出一种生成模型 能够进行音乐合成和源分离
一项来自意大利的新的人工智能研究介绍了一种基于扩散的生成模型,能够同时进行音乐合成和源分离。这种模型使用了源的联合概率密度作为先验分布进行训练,通过对先验进行采样来进行生成任务,通过将先验分布与混合物进行条件化并从结果的后验分布中进行采样来进行分离任务。站长网2023-07-21 17:06:410000专注于去中心化人工智能的初创公司 Ritual 获得 2500 万美元融资
站长之家(ChinaZ.com)11月9日消息:在Web3投资者NirajPant和前Palantir建筑师AkileshPotti的带领下,去中心化人工智能平台Ritual宣布完成2500万美元种子轮融资。由Archetype领投,Accomplice和RobotVentures参投。站长网2023-11-09 14:42:010000LeCun:超级AI不会主宰人类,但必须开源
要点:LeCun认为,未来将会有超越人类智能的人工智能,但这些智能不会主宰人类,而是成为与数字世界互动的中介。他强调这些人工智能必须是开源的,以确保每个人都能参与学习和优化。在LeCun看来,智能与统治没有必然联系,控制欲是社会性物种的本性,而人工智能可以被设计成智能但不具备统治欲的系统。他强调了开源的必要性,以避免少数公司垄断超级人工智能,从而左右每个人的观点和文化。站长网2023-11-27 14:13:150000B站发布2023年Q2财报:营收53.04亿元 调整后净亏损同比收窄51%
凤凰网科技讯8月17日消息,哔哩哔哩(NASDAQ:BILI,HKEX:9626;以下简称“B站”)公布了截至2023年6月30日的第二季度未经审计的财务报告。财报显示,第二季度B站总营收达53.04亿元人民币,同比增长8%;毛利润实现同比增长66%,调整后净亏损同比收窄51%。0001