通义千问72B模型荣登大模型评测平台OpenCompass榜首
站长网2023-12-13 11:57:481阅
中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。
OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的能力。
在OpenCompass的中文数据集评测中,Qwen-72B基础大型模型和对话大型模型(Qwen-72B-Chat)分别占据了前两名,显著优于其他模型。

在12月初,阿里云宣布开源其拥有720亿参数的大型语言模型通义千问Qwen-72B。Qwen-72B在十个权威基准测评中创下了开源模型的最佳成绩,从而成为业界最强大的开源大型模型。其性能超越了开源的标杆模型Llama2-70B以及大部分商业的非开源模型,适合于企业级和科研级的高性能应用。
据了解,通义千问-72B可以处理最长为32k的文本输入,并且在长文本理解测试集LEval上的表现超过了ChatGPT-3.5-16k。
0001
评论列表
共(0)条相关推荐
嘉楠科技Canaan开源通用大语言模型Toucan
近日,嘉楠科技(Canaan)发布了参数量为70亿的通用大语言模型Toucan-7B及INT4量化版本Toucan-7B-4bit。站长网2023-08-31 08:45:340000跟长辈沟通不了,年轻人选择和AI掏心窝子。
文章开头,世超来个暴论。预计不久后,越来越多的年轻人会成为电影《Her》里的主角,和AI当朋友,谈恋爱。当然原因并不是AI变强了,而是——当代年轻人正饱受沟通之苦。最近世超刷到个帖子说:ChatGPT这个本来提高工作效率的工具,现在被一堆年轻人当成了心理咨询师。平时大伙儿不敢问的,不敢说的,都要找和它唠唠。帖子非常火,18000点赞,2700条评论。0000从零复现Llama3代码库爆火 Karpathy大神称赞作者是个有品的人
最近,一个教你从头开始实现Llama3的代码库在网上爆火,吸引了无数开发者的关注。知名AI专家AndrejKarpathy一键三连(点赞、转发、评论),这个项目在社交媒体X上的转赞收藏量超过6.8k,GitHub上更是收获了超过2k的星标。站长网2024-05-22 00:48:490000选好出海目的地,开发者就成功了一半
来自中国的移动应用,正在全球新兴市场“攻城略地”。随着智能手机的兴起和移动通信网络的发展,移动应用已经成为全球用户必不可少的生活娱乐工具。尤其在新兴市场,这种表现更为明显。而近年来,随着国内移动应用的用户增量明显放缓,中国企业开发的移动应用也加快了出海步伐,这其中不乏Temu、《GarenaFreeFire》等优秀移动应用成为海外市场的KILLERAPP(杀手级应用)。站长网2023-11-14 17:53:110000小红书带货二姐|GMV500万+的背后是什么
你敢信吗,从3月31日到5月22日,短短2个月时间不到,小红书已经培育了2位直播大佬,董洁和章小蕙分别登场小红书直播带货,吸引了大批用户的疯狂购买,同时也带动了小众品牌以及高单价产品在小红书销量增长。章小蕙的直播首秀让平台带货热度达到了6亿,冲向销量榜一,而董洁则在连续8小时的高强度直播中傲视榜单,两位女性分别交出了令人瞩目的带货成绩,为小红书直播电商创造了迄今为止最好的成绩。—1—站长网2023-05-29 13:51:140000