出门问问开放大模型“序列猴子”开源数据集
站长网2024-02-26 09:03:490阅
出门问问宣布,将向公众开放其超大规模语言模型“序列猴子”的部分训练数据集,命名为“序列猴子开源数据集1.0”。
序列猴子,作为出门问问的核心技术之一,具备强大的通用表示与推理能力,已在问答系统、自然语言处理、机器翻译、文本摘要等多个领域展现出其卓越的性能,极大地提高了生产效率和数据处理能力。

为了推动大语言模型技术的持续进步,出门问问决定将其部分训练数据集进行开源。这次开源的“序列猴子开源数据集1.0”包括中文通用文本语料、古诗今译语料以及文本生成语料,这些数据资源都经过精心挑选和整理,以确保其高质量和易用的数据格式。同时,公司采用了宽松的许可协议,为广大的开发者和研究人员提供了便捷的使用条件。
出门问问希望通过这一行动,吸引更多的人才和团队参与到大语言模型的研究与应用中来,共同推动这一前沿技术的持续进步。公司坚信,开源数据集的发布将促进学术交流与合作,加速相关领域的创新步伐。
项目地址:https://github.com/mobvoi/seq-monkey-data
0000
评论列表
共(0)条相关推荐
爆火的村超,你学不会
今年暑假,贵州旅游火了。去年夏天,贵州台江县,人口不足2000人的台盘村举办了一场乡村篮球比赛,“村BA”意外出圈。今年5月,距其不到200公里的榕江县,举办了村级足球联赛,没想到再一次点燃了全网热情。村BA和村超的走红,有异曲同工之妙。0001手握15个大厂offer,我在大模型风口起飞
猎聘的一份报告显示,2024年一季度国内生成式人工智能的相关职位数同比增321.7%。其中,50万以上的年薪段增速最快,超过500%。大厂需要前5%的顶尖人才去完成“95%的人无法完成的事情”,并不惜为此开出丰厚报酬。生成式人工智能岗位急增300%以上,但相应领域的求职人数增速则超过了900%。岗位有限,求职依然面临着僧多粥少的问题。站长网2024-08-21 14:17:430000董明珠计划办选秀 前10名可参加家宴:将亲自下厨
格力电器董事长董明珠在最近的一次采访中,不仅展现了对自家产品质量的坚定信心,还分享了格力如何通过技术创新和卓越品质赢得消费者信任的经验。董明珠表示,许多消费者因为信赖格力的品质,甚至直接拨打她的电话来咨询或解决问题。站长网2024-05-15 17:27:410000报道称:苹果挖掘 AI 人才并建立秘密实验室
划重点:🔍苹果吸引谷歌AI专家加盟扩大团队🔍苹果在苏黎世设立秘密实验室🔍苹果展开AI领域竞争计划据英国金融时报报道,苹果近年来从谷歌挖走了多名员工,以扩大其全球人工智能(AI)和机器学习团队。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2024-05-01 15:06:500001