商汤与上海AI实验室等发布“书生·浦语”大模型
站长网2023-06-08 07:06:200阅
近日,商汤科技、上海AI实验室联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型“书生·浦语”(InternLM)。“书生·浦语”具有1040亿参数,是在包含1.6万亿token的多语种高质量数据集上训练而成。
全面评测结果显示,“书生·浦语”不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力,因而在综合性考试中表现突出,在多项中文考试中取得超越ChatGPT的成绩,其中就包括中国高考各个科目的数据集(GaoKao)。
“书生·浦语”不仅显著超越了GLM-130B和LLaMA-65B等学术开源模型,还在AGIEval、C-Eval,以及Gaokao等多个综合性考试中领先于ChatGPT;在以美国考试为主的MMLU上实现和ChatGPT持平。
“书生·浦语”技术报告:https://github.com/InternLM/InternLM-techreport
0000
评论列表
共(0)条相关推荐
蔚来与吉利控股签署换电战略合作协议
2023年11月29日,浙江吉利控股集团有限公司与蔚来控股有限公司在杭州签署了换电战略合作协议,双方将在换电电池标准、换电技术、换电服务网络建设及运营、换电车型研发及定制、电池资产管理及运营等多个领域展开全面合作。站长网2023-11-29 14:01:430000日本将开发更强日语能力的“大语言模型”人工智能技术
据共同社消息,日本东北大学和日本东京工业大学等团队计划开发一种更强日语能力的“大语言模型”,作为生成式人工智能(AI)的基础技术。该团队将利用理化学研究所的超级计算机“富岳”学习大量数据,并将在本年度内逐步公开。这一技术的开发将使国内企业和研究人员能够为自己的公司的服务或研究而自行改良。生成式AI可以按照用户的要求生成文章、图像、音频等。站长网2023-05-23 11:05:590000十年烧了3000亿,自动驾驶迎来梦醒时分
FastReading融资困难、人才逃离、岗位骤减,自动驾驶已不再是性感的赛道。L4迟迟无法落地,商业化前景更明确的L2成为重要造血手段。自动驾驶告别培育期,适者生存,活下来将成为未来几年的主题。被资本冷落3年后,关于自动驾驶的一切开始出现更深的裂痕。站长网2023-07-06 22:10:320002摩尔线程复原阿里的单图跳舞项目Moore-AnimateAnyone 用户可训练自己的AnimateAnyone模型
日前,摩尔线程的单图跳舞项目已经复原,并且已经开源训练代码。这意味着你现在可以使用自己的AnimateAnyone模型进行训练。另外,基于摩尔线程开源的版本制作了ComfyUI节点,并且提供了基础的工作流。这意味着现在可以在ComfyUI中非常简单地让单图跳舞了。这一突破将为动画创作带来新的可能性,让更多人能够参与到动画创作中来。站长网2024-01-22 10:15:090001蚂蚁集团:贞仪大模型已研发数月 尚未达到对外公布的阶段
在世界人工智能大会上,蚂蚁集团副总裁、蚂蚁技术研究院院长陈文光透露,蚂蚁贞仪大模型目前尚未达到对外公布的阶段。陈文光表示,虽然国内已经有一些同行推出了大模型产品,但蚂蚁认为需要自己亲身实践,去理解这项技术中的局限性和能力。他提到,蚂蚁独特的业务场景和数据可以在大模型的应用方面取得成果。他强调,蚂蚁在这个领域的研发已经持续了几个月,正在不断探索和深化对大模型技术的理解和应用。站长网2023-07-06 14:58:370001