科大讯飞发布讯飞星火认知大模型V1.5 高考数学题正确率50%
站长网2023-06-09 23:45:281阅
今日,科大讯飞举办了讯飞星火认知大模型V1.5升级发布会,正式推出了新版本。会上,科大讯飞展示了大模型在今年高考中的答题能力,讯飞星火凭借出色表现成为了答题正确率最高、“最聪明”的AI大模型。
在数学题测试中,媒体选了数学高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。测试结果显示,这五款大模型在答数学题的能力上存在显著差异。讯飞星火答对了5题,正确率达到50%,成为大模型数学能力排名第一。百度文心一言和ChatGPT答对了4题,正确率为40%,位列其后。
此外,在语文主观作答中,ChatGPT的高考作文得分最高,文心一言和讯飞星火得分略低,但处于相同水平。而在英语考试中,讯飞星火和ChatGPT明显领先于其他模型。
0001
评论列表
共(0)条相关推荐
商汤与上海AI实验室等发布“书生·浦语”大模型
近日,商汤科技、上海AI实验室联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型“书生·浦语”(InternLM)。“书生·浦语”具有1040亿参数,是在包含1.6万亿token的多语种高质量数据集上训练而成。站长网2023-06-08 07:06:200000OpenAI 领导者提议 AI 国际监管机构:世界需要「人工智能版国际原子能机构」
站长之家(ChinaZ.com)5月23日消息:人工智能的发展速度足够快,它可能带来的危险也足够明显,以至于OpenAI的领导层认为,世界需要一个类似于管理核能的国际监管机构——而且速度要快。但不能太快。站长网2023-05-23 09:04:060000iPhone 15或不能用共享充电宝?客服:只支持苹果充电线
快科技9月13日消息,尽管iPhone15全系更换成了Type-C接口,但问题似乎更多了。其中最尴尬的是,安卓手机常用的Type-C数据线,有可能无法给苹果iPhone15充电。有媒体就iPhone15能否使用第三方Type-C充电线进行充电?”这一问题咨询了苹果官方客服,得到的回答是否定的:目前只支持苹果附赠的充电线充”。0000印度航空成为全球首家推生成式AI机器人的航空公司
**划重点:**1.🌐"Maharaja"管理超过1,300个领域的广泛客户查询,包括航班状态、行李津贴等。2.🚀每天处理超过6,000个查询,成功回答超过80%的问题。3.💬空中印度采用多种机器学习技术,结合生成式AI,实现新一轮客户服务革命。站长网2023-11-10 17:16:410000索尼上调 2023 财年业绩预期,PS5 预计销售 2500 万台
日本索尼集团(SONY.US)在周三发布了截至2023财年第一季度(截至6月30日)的业绩报告。报告显示,由于电影和金融业务的不佳表现,该集团的第一季度营业利润大幅下降。尽管如此,该集团的第一季度营业利润与分析师的预期相符,达到了约2530亿日元(约17.7亿美元)的水平。站长网2023-08-09 16:46:500000