商汤国产中文大模型全面领先ChatGPT 部分接近GPT-4

站长网2023-06-23 23:42:211阅

快科技6月21日消息，在AI大模型领域，OpenAI的ChatGPT成为当前最火的大模型，也是标杆性的，多个国产大模型都要对标它，今天商汤科技公布了自己的大模型测试结果，三个测试项目中都超越了ChatGPT。

商汤科技自研中文语言大模型名为商量SenseChat 2.0”，日前公布的测试显示，MMLU、AGIEval、C-Eval三个权威大语言模型评测基准的成绩。

根据评测结果，商量SenseChat 2.0”在三个测试集中表现均领先ChatGPT，部分已十分接近GPT4的水平，实现了我国语言大模型研究的重要突破。

这三个测试分别如下：

由美国加州大学伯克利分校等高校构建的多任务考试评测集MMLU；

微软研究院推出的学科考试评测集AGIEval（含中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等）；

由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval；

在MMLU测试中，商量SenseChat 2.0”综合得分为68.6，远超GLM-130B（45.7分）的得分，同时还超过了ChatGPT（67.3分）、LLaMA-65B（63.5分）仅落后GPT-4（86.4分），位居第二。

在AGIEval测试中，商量SenseChat 2.0”测出49.91的分数，遥遥领先GLM-130B（34.2分）、LLaMMA-65B（34.0分），并再次超越ChatGPT（42.9分），仅次于GPT-4的56.4分。

在其中的AGIEval（GK）评测子集中，商量SenseChat 2.0”以58.5分全面领先，仅微弱差距落后GPT-4（58.8分）。

在C-Eval测试中，商量SenseChat 2.0”拿到了66.1的分数，在参评的18个大模型中，仅次于GPT-4（68.7分），全面领先ChatGPT、Claude、Bloom、GLM-130B、LLaMA-65B等一众海内外大模型。

截至目前，已有近千家企业客户通过申请，应用和体验商量SenseChat 2.0”超强的长文本理解、逻辑推理、多轮对话、情感分析、内容创作、代码生成等综合能力，并且商量SenseChat 2.0”还在服务客户过程中，持续实现着快速迭代和提升，以及知识的实时更新。

商汤国产中文大模型全面领先ChatGPT部分接近GPT4

0001

评论列表

共(0)条

相关推荐

站长资讯
iPhone 16 Pro系列将标配潜望镜头：已开始生产支持5倍变焦
快科技7月6日消息，据DigiTimes最新报道，苹果将在iPhone16Pro中引入iPhone15ProMax同款5倍光学变焦四棱镜潜望镜头。报道称，目前苹果已经将模组订单交至大立光电和玉晶光电开始生产。这就意味着，今年iPhone16Pro系列将标配潜望式长焦镜头，支持5倍光学变焦。
站长网2024-07-06 16:14:58
0000
2023进击的协同办公：拥抱AI、组织调整、加速赚钱 | 年度盘点
协同办公软件“三国杀”在2023年讲了点新故事。故事的关键词是“AI”，大语言模型在文字、图片生成处理方面的巨大优势使其天然适用于办公场景。这一年，钉钉和飞书都在积极将AI能力融入自家产品体系，为新一轮的用户增长和商业化铺就道路。
站长网站长资讯2024-02-06 17:50:10
0000
站长资讯
YouTube 推出一系列新 AI 工具包括Dream Screen、Aloud等
在“MadeOnYouTube”活动上，YouTube宣布了一系列新的AI技术工具，旨在推动创造力的边界。这些新功能包括AI生成的背景、视频灵感洞察和视频制作辅助工具。
站长网2023-09-22 08:25:47
0000
荣耀Magic7系列官宣支持AI鹰眼相机、雅顾人像拍照等功能
荣耀公司今日宣布，其即将推出的Magic7系列手机将在摄影功能上实现重大突破，新机型将引入AI鹰眼相机和创新的雅顾人像拍摄技术。
站长网站长资讯2024-10-29 11:38:45
0000
站长资讯
超小米荣耀！华为HarmonyOS 4无障碍适配获最高五星评分
快科技2月1日消息，今日，华为终端BG、首席运营官何刚发微博称，截止今年，华为已连续三年超越多个手机品牌，获得凤凰评测推荐视障用户使用的品牌”以及最高的五星评分。他表示，华为的HarmonyOS4操作系统，借助智能问答，助听器直连、长辈关怀、小艺通话等功能，解决了障碍用户和老年人群体在工作及生活中遇到的许多问题。未来，华为也会坚持做好信息无障碍方面的适配。
站长网2024-02-01 21:11:20
0000