智源研究院开源代码生成训练数据集与评测基准TACO
站长网2023-12-25 18:52:261阅
TACO 是一个专注于算法的代码生成数据集,旨在为代码生成模型提供更具挑战性的训练数据集和评测基准。
与当前主流代码评测基准相比,TACO 在数据规模、数据质量和细粒度评测方案上具有明显优势。它包括更大规模的训练集和测试集,每个题目都具备多样化的解题答案,并提供了细粒度的标签,如任务主题、算法、编程技能和难度等级。
实验结果表明,当前流行的代码生成模型在 TACO 评测中与 GPT-4存在显著差异,说明这一领域仍有巨大的提升空间。
TACO 数据集不仅提供了一个挑战性的测试方法,还能作为研究和改进模型性能的训练数据。通过社区的共同努力,可以激发更多创新的解决方案,进一步推动代码生成领域的发展。
具体特性如下:
规模更大:TACO 包括训练集(25443道题目)和测试集(1000道题目),是当前规模最大的代码生成数据集。
质量更高:TACO 数据集中的每个题目都尽可能匹配多样化的解题答案,答案规模高达155万条,确保训练时模型不易过拟合以及评测结果的有效性。
提供细粒度标签:TACO数据集中每个题目均包含任务主题、算法、技能及难度等细粒度标签,为代码生成模型的训练与评测更精确的参考。
TACO 开源地址:
论文:https://arxiv.org/abs/2312.14852
智源开放数据仓库:https://data.baai.ac.cn/details/BAAI-TACO
GitHub:https://github.com/FlagOpen/TACO
Hugging Face:https://huggingface.co/datasets/BAAI/TACO
新鲜AI产品点击了解:https://top.aibase.com/
0001
评论列表
共(0)条相关推荐
微软宣布 GPT-4o 模型在 Azure OpenAI 上使用
划重点:🔸微软宣布OpenAI最新的多模态模型GPT-4o可在AzureOpenAI上使用🔸GPT-4o支持跨文本、视频、音频多模态推理,具有强大的多模态解读、输出能力🔸GPT-4o在教育、语言学习、形象评价等领域有广泛应用前景日前,微软宣布OpenAI最新发布的多模态模型GPT-4o现已可以在AzureOpenAI云服务中使用。站长网2024-05-15 09:15:160001CPU处理器价格越来越贵 笔记本除外:大跌9%
快科技4月30日消息,去年下半年到现在,PC市场也遇到了需求大幅下滑的难题,出货量创造了10多年来新低,AMD及Intel两大CPU厂商的业绩都不太好看,CPU价格反而越来越贵,不过桌面及笔记本情况又不同。Intel上周五发布了Q1季度财报,营收下滑了36%,创造了2010年以来的历史新低,并且连续2个季度亏损。站长网2023-05-12 20:40:350000董明珠:格力正开发不要电的空调 0电费直连光伏
8月2日,格力电器在河北举办了一场名为“格力冰洗生活电器战略发布会”的会议,公司董事长兼总裁董明珠在会上进行了演讲。董明珠宣布,格力正在研发一种革命性的空调产品,这款空调的特点是“不用电”,该技术的研发始于2012年,经过了长期的创新和改进。站长网2024-08-06 14:02:390000Meta打造巨型AI模型 为视频推荐引擎注入新活力
互联网巨头Meta正致力于开发一款超大规模的人工智能系统,旨在为其旗下的视频推荐引擎注入新的活力,从而提升用户体验。Facebook的负责人汤姆·埃利森透露,这款巨型人工智能推荐模型是Meta到2026年技术路线图的关键组成部分。该模型不仅能为类似于TikTok的Reels短视频服务提供支持,更能适应传统的长视频内容,为用户提供更加精准的推荐。站长网2024-03-07 16:12:200001OpenAI CEO Sam Altman因涉嫌误导投资者正接受SEC调查
**划重点:**1.🕵️♂️SEC对OpenAI及其CEOSamAltman进行调查,涉及公司向投资者发表的声明。2.📧SEC正在审查Altman及其他人的电子邮件,以确定投资者是否在去年11月的动荡中受到误导。3.🏛️调查集中在纽约,涉及OpenAI高管被要求保留内部文件,同时公司内部和独立调查齐头并进。站长网2024-03-01 11:21:090000