通义千问72B模型荣登大模型评测平台OpenCompass榜首
站长网2023-12-13 11:57:481阅
中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。
OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的能力。
在OpenCompass的中文数据集评测中,Qwen-72B基础大型模型和对话大型模型(Qwen-72B-Chat)分别占据了前两名,显著优于其他模型。

在12月初,阿里云宣布开源其拥有720亿参数的大型语言模型通义千问Qwen-72B。Qwen-72B在十个权威基准测评中创下了开源模型的最佳成绩,从而成为业界最强大的开源大型模型。其性能超越了开源的标杆模型Llama2-70B以及大部分商业的非开源模型,适合于企业级和科研级的高性能应用。
据了解,通义千问-72B可以处理最长为32k的文本输入,并且在长文本理解测试集LEval上的表现超过了ChatGPT-3.5-16k。
0001
评论列表
共(0)条相关推荐
天涯社区3月1日恢复业务 计划推出社交电商平台
2月28日下午,天涯社区创始人、董事长邢明就近期天涯社区因一名员工申请破产审查的事件进行了回应。邢明透露,天涯社区计划在3月1日全面恢复业务,并发布新天涯创建计划和时间表。邢明表示,这次破产审查的申请是由一名员工因被拖欠工资而提出的。他坦言,天涯社区在过去确实面临了一些困难,包括资金流动性问题和员工数量的减少。然而,他强调公司团队一直在努力进行债务重组,并确保网站数据的安全。站长网2024-02-29 13:55:450000一体压铸真香!特斯拉或大幅降低Model 2生产成本:15万拿下
快科技9月15日消息,在尝到了一体式压铸降低成本的甜头之后,特斯拉对这种技术欲罢不能。据海外媒体报道,在ModelY的一体压铸工艺大获成功后,特斯拉会将该技术改进后应用到Model2身上,以更好地降低新车的生产成本,据称,其正在寻找更大压力的冲压机,生产ModelY的机器可输出6000至9000吨的压力,而特斯拉希望新机器能输出16000吨的压力。站长网2023-09-15 16:06:350000消息称在Apple Watch中 最贵的Ultra比最便宜的SE更受欢迎
据外媒报道,最新报告显示,在苹果今年二季度所售的iPhone中,最贵的iPhone15ProMax占比是最高的,达到了22%,其次是iPhone15,占19%。站长网2024-08-17 10:05:220000雀巢回应被网易举报:二手制冰机非自己生产
最近国内多家媒体报道了网易员工发现公司制冰机是腾讯二手设备一事,迅速在网络上引发了热议。据媒体报道,针对网易公开举报“雀巢”一事,雀巢方面回应称,他们最近注意到了关于网易向国家市场监管总局举报雀巢及其经销商向网易提供二手制冰机的相关报道。对此,他们高度重视并第一时间展开内部调查。站长网2023-11-14 16:31:350000钉钉:已有12条产品线、40多个场景接入AI
钉钉近日公布了将大模型接入其产品后的进展情况。知识库、Teambition、白板等工具都已加入AI能力,使得钉钉的12条产品线和40多个场景能够更好地应用大模型的能力。用户现在可以通过输入自然语言并使用斜杠“/”来生成PPT、思维导图、数据分析图表、项目看板等文件格式。这一功能的加入使得用户在使用钉钉产品时能够更加方便快捷地完成各种任务,提高了工作效率。站长网2023-07-26 11:51:430002