通义千问72B模型荣登大模型评测平台OpenCompass榜首
站长网2023-12-13 11:57:481阅
中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。
OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的能力。
在OpenCompass的中文数据集评测中,Qwen-72B基础大型模型和对话大型模型(Qwen-72B-Chat)分别占据了前两名,显著优于其他模型。
在12月初,阿里云宣布开源其拥有720亿参数的大型语言模型通义千问Qwen-72B。Qwen-72B在十个权威基准测评中创下了开源模型的最佳成绩,从而成为业界最强大的开源大型模型。其性能超越了开源的标杆模型Llama2-70B以及大部分商业的非开源模型,适合于企业级和科研级的高性能应用。
据了解,通义千问-72B可以处理最长为32k的文本输入,并且在长文本理解测试集LEval上的表现超过了ChatGPT-3.5-16k。
0001
评论列表
共(0)条相关推荐
Midjourney 计划未来几个月推出“文本转视频”模型
**划重点:**1.🎥Midjourney计划在未来几个月推出“文本转视频”模型,将其AI形象生成器扩展到视频创作领域。2.🤖公司将于1月开始培训视频模型,CEODavidHolz表示这是平台的自然发展,将竞争动态引入生成视频行业。3.🌐与竞争对手相比,MidJourney的最新v6更新着重于提高画质和用户体验,预示着AI视频生成领域的激烈竞争。站长网2024-01-03 14:12:150000OPPO:基于AndesGPT大模型的新小布1.0公测开启
今天,OPPO宣布启动基于AndesGPT大模型的全新小布助手的第一轮公开测试。新的AndesGPT大模型通过4位量化技术,可以在不影响精度的前提下,实现在端侧的逐步部署和性能优化。AndesGPT大模型是由OPPO旗下的安第斯智能云团队打造,是一种基于混合云架构的生成式大语言模型。它融合了中文对话数据的持续学习、指令精调、人类反馈强化学习和知识增强等关键技术。站长网2023-10-11 17:16:390000一小时 12 元,我在北欧监狱里训练 AI
芬兰工资水平普遍较高,并且很少有人从事互联网行业。外媒wired实地走访发现,一家名为Metroc的大模型创业公司发现了一种新型劳动力——囚犯。芬兰囚犯的新工作:帮创业公司训练大模型在一个没有窗户的房间里,隔着一张消过毒的白色桌子,我被介绍给了一位四十多岁的女性,她有着方形下巴,用一个淡蓝色的发带把金色的头发扎成了马尾。她说:“大家都叫我果酱”,让我也这么称呼她。站长网2023-10-03 09:49:180000罗永浩今晚带货售价239万“空中的士”!定金3.99万元
快科技3月20日消息,据媒体报道,交个朋友消息显示,今天(3月20日)晚上19点,罗永浩将在交个朋友淘宝直播间带货亿航空中的士”。报道还表示,据知情人士透露,此次在淘宝直播间上架的链接定金为3.99万元,全价的折扣幅度更大。前两天,全球首个获得适航认证的国产自研空中的士”亿航EH216-S在淘宝上架,标价239万元。0000