科大讯飞发布讯飞星火认知大模型V1.5 高考数学题正确率50%
站长网2023-06-09 23:45:281阅
今日,科大讯飞举办了讯飞星火认知大模型V1.5升级发布会,正式推出了新版本。会上,科大讯飞展示了大模型在今年高考中的答题能力,讯飞星火凭借出色表现成为了答题正确率最高、“最聪明”的AI大模型。
在数学题测试中,媒体选了数学高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。测试结果显示,这五款大模型在答数学题的能力上存在显著差异。讯飞星火答对了5题,正确率达到50%,成为大模型数学能力排名第一。百度文心一言和ChatGPT答对了4题,正确率为40%,位列其后。
此外,在语文主观作答中,ChatGPT的高考作文得分最高,文心一言和讯飞星火得分略低,但处于相同水平。而在英语考试中,讯飞星火和ChatGPT明显领先于其他模型。
0001
评论列表
共(0)条相关推荐
带你探索AI面试的奇妙经历,结果令人惊喜!
朋友们,我刚体验了一把AI面试,着实把我震惊得不小。先划重点!!1.AI面试可行,可用。不仅可以查漏补缺,还能增强表达能力和自信,重要的面试机会一定要提前演练,大大提升面试成功率。2.要使用GPT-4模型,3.5与4的差距还是很大。3.提示词可以参照我的修改,把面试职位和项目改为自己的就行。话不多说,直接看站长网2023-05-23 18:04:430000AI大模型真的引领了国内的“资本盛宴”吗?是,也不是
站长网2023-07-25 22:33:300000大学教授重拾纸质考试和手写作业 与使用 ChatGPT 的学生作对抗
站长之家(ChinaZ.com)8月14日消息:越来越多的学生在课程中使用人工智能程序ChatGPT作为作业的捷径,这导致一些大学教授重新考虑了他们下个秋季学期的教学计划。OpenAI的ChatGPT每天都在进步。这个聊天机器人在AP生物考试中取得了最高分,并以3.34的平均绩点通过了哈佛大学的大一年级。站长网2023-08-14 11:51:400000数字地图公司TomTom与微软合作开发基于人工智能的车载对话助手
划重点:1.🚗TomTom与微软合作,共同开发了一款基于人工智能的车载对话助手。2.🗺️这款助手能够让用户与车辆进行自然对话,并实现与信息娱乐、位置搜索和车辆控制系统的语音交互。3.💡TomTom利用了微软的AzureOpenAI服务和OpenAI的大型语言模型,将该对话助手整合到其他车载信息娱乐系统中,并内置于TomTom的数字驾驶舱平台。0000OpenAI首席执行官计划访问首尔寻找芯片合作伙伴
**划重点:**1.🇺🇸OpenAI首席执行官SamAltman计划访问首尔,与SK集团主席CheyTae-won会面,寻求半导体合作,减少对美国人工智能芯片领导者Nvidia的依赖。2.🤝Altman强烈愿意与国内芯片制造商合作,以开发人工智能加速器,并将在访问期间讨论与韩国半导体业界人士的人工智能芯片合作。站长网2024-01-22 16:09:280000