科大讯飞发布讯飞星火认知大模型V1.5 高考数学题正确率50%
站长网2023-06-09 23:45:281阅
今日,科大讯飞举办了讯飞星火认知大模型V1.5升级发布会,正式推出了新版本。会上,科大讯飞展示了大模型在今年高考中的答题能力,讯飞星火凭借出色表现成为了答题正确率最高、“最聪明”的AI大模型。

在数学题测试中,媒体选了数学高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。测试结果显示,这五款大模型在答数学题的能力上存在显著差异。讯飞星火答对了5题,正确率达到50%,成为大模型数学能力排名第一。百度文心一言和ChatGPT答对了4题,正确率为40%,位列其后。
此外,在语文主观作答中,ChatGPT的高考作文得分最高,文心一言和讯飞星火得分略低,但处于相同水平。而在英语考试中,讯飞星火和ChatGPT明显领先于其他模型。
0001
评论列表
共(0)条相关推荐
聊聊小红书直播带货、社交价值和设计师品牌
本期我们聊的话题涉及小红书电商、中国原创设计师品牌的代际更迭,以及为什么消费品牌要从流量品牌过度到商业品牌。对谈嘉宾是小红书博主Moni,Moni过往的职业分别涉及高端生活方式杂志、奢侈品公司LVMH、连卡佛·载思集团,始终围绕内容、时尚、买手、品牌等等几个关键词。目前她在广州筹备自己的品牌,会帮一些品牌做咨询顾问,也在小红书做直播带货,还在跟其中一些品牌尝试联名合作,探索直播带货新方向。0000开启新一轮红利期,TikTok Shop美区单场直播破百万美金
近日,在一场TikTokShop平台美国直播中,美容品牌主播StormiSteele达成了销售额突破100万美金的成绩,也刷新了美国单场直播纪录。有媒体评价Stormi成为美国第一位在单场TikTokShop直播中收获百万美元的达人,这开创了一种前所未有的创业道路,集娱乐、发现和购物为一体,为美国直播购物树立了新标杆。美国小镇女孩的创业故事站长网2024-06-17 18:24:040000鸡飞狗跳的跨晚排位赛,有没有一个走心的
刚刚过去的2024跨年晚会,各家平台卫视争奇斗艳,使出浑身解数抢占观众视线。大家都不约而同地使出同一个杀招——怀旧。不管是黄晓明、苏有朋在湖南卫视合体演唱《当》《雨蝶》,还是张艺兴陶喆和8岁的张加帅在江苏卫视演绎《找自己》,无一不在这个辞旧迎新的时刻,用童年金曲唤醒大众的集体记忆。但是认真怀旧的只有他,从开场就用一首《武林外传》插曲,把我们拉进一场时间回溯的梦境。0000微软开源多功能视觉模型Florence-2,分割、识别一切图片!
微软AzureAI团队宣布开源视觉模型——Florence-2。据悉,Florence-2是一个多功能视觉模型,可提供图像描述、目标检测、视觉定位、图像分割等。例如,上传一张风景照片,让其解读一下图片的内容;或者上传一张超市货架的照片,让其精准找出牛奶的所在位置。站长网2024-11-17 11:52:550003明年3月上市!小米SUV起售价曝光:可能23.59万元起
快科技11月29日消息,最新消息显示,小米第二款车型计划于明年2月或3月上市。据说,小米第二款新车的上市节奏将与SU7保持一致。而SU7是在2024年3月28日正式上市的。业界推测,这款车将直接对标特斯拉ModelY。值得一提的是,除了纯电SUV,小米还将推出一款增程式SUV。0000