科大讯飞发布讯飞星火认知大模型V1.5 高考数学题正确率50%

站长网2023-06-09 23:45:281阅

今日，科大讯飞举办了讯飞星火认知大模型V1.5升级发布会，正式推出了新版本。会上，科大讯飞展示了大模型在今年高考中的答题能力，讯飞星火凭借出色表现成为了答题正确率最高、“最聪明”的AI大模型。

在数学题测试中，媒体选了数学高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。测试结果显示，这五款大模型在答数学题的能力上存在显著差异。讯飞星火答对了5题，正确率达到50%，成为大模型数学能力排名第一。百度文心一言和ChatGPT答对了4题，正确率为40%，位列其后。

此外，在语文主观作答中，ChatGPT的高考作文得分最高，文心一言和讯飞星火得分略低，但处于相同水平。而在英语考试中，讯飞星火和ChatGPT明显领先于其他模型。

科大讯飞发布讯飞星火认知大模型V15 高考数学题正确率50

0001

评论列表

共(0)条

相关推荐

站长资讯
Abacus AI 推出开放式上下文大语言模型Long Context
站长网2023-08-04 15:59:11
0000
特供版RTX 5090D被曝不能「炼丹」！AI算力3秒锁死，不支持多GPU配置
【新智元导读】英伟达针对中国市场即将发售的RTX5090D被曝出无法「炼丹」，3秒即可自动锁死算力。而且也不再支持多卡服务器配置与超频。该显卡或成「笼中金雀」，只能供游戏党细细赏玩了。就在刚刚，最新爆料称，中国特供版的RTX5090D不能「炼丹」!
站长网站长资讯2025-01-18 10:44:17
0000
站长资讯
算力不足，小模型成AI模型发展下个方向？
大模型不是AI的唯一出路，把模型做小也是本事。这段时间，AI模型界是真的热闹，新的模型不断涌现，不管是开源还是闭源，都在刷新成绩。就在前几天，Meta就上演了一出“重夺开源铁王座”的好戏。发布了Llama38B和70B两个版本，在多项指标上都超越了此前开源的Grok-1和DBRX，成为了新的开源大模型王者。
站长网2024-04-24 16:16:01
0000
站长资讯
智能海报生成平台嗨AI海报 30秒批量生成带货海报
AI海报是一个提供免费AI智能海报生成的平台，只需输入一句话，即可快速生成各种节日海报、日签、邀请函、电商主图、公告通知、喜报、倒计时等内容。这个平台可以一键生成多种设计风格和模板，无需复杂的设计技能，只需30秒，即可批量生成带货海报，极大地提高了设计效率。官网地址：https://top.aibase.com/tool/heiaihaibao
站长网2024-02-01 10:14:01
0000
站长资讯
日本发布指导方针允许在学校有限使用ChatGPT等生成式AI
近日，日本教育部已发布指导方针，允许在小学、初中和高中有限使用ChatGPT等生成式人工智能。在认识到学生牢固掌握人工智能及其用途的重要性的同时，该指南还考虑到该技术可能会对学生的批判性思维和其他技能产生负面影响。该指南呼吁小学生谨慎使用，因为ChatGPT使用条款建议仅由13岁及以上的人使用。日本执政党和政府中的一些人对允许年轻人接触人工智能持谨慎态度。
站长网2023-07-05 17:28:25
0001