科大讯飞发布讯飞星火认知大模型V1.5 高考数学题正确率50%
站长网2023-06-09 23:45:281阅
今日,科大讯飞举办了讯飞星火认知大模型V1.5升级发布会,正式推出了新版本。会上,科大讯飞展示了大模型在今年高考中的答题能力,讯飞星火凭借出色表现成为了答题正确率最高、“最聪明”的AI大模型。
在数学题测试中,媒体选了数学高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。测试结果显示,这五款大模型在答数学题的能力上存在显著差异。讯飞星火答对了5题,正确率达到50%,成为大模型数学能力排名第一。百度文心一言和ChatGPT答对了4题,正确率为40%,位列其后。
此外,在语文主观作答中,ChatGPT的高考作文得分最高,文心一言和讯飞星火得分略低,但处于相同水平。而在英语考试中,讯飞星火和ChatGPT明显领先于其他模型。
0001
评论列表
共(0)条相关推荐
阿里魔搭社区开源一站式视频生成工具MotionAgent
近日,阿里巴巴达摩院旗下魔搭社区(ModelScope)宣布开源一站式视频生成工具MotionAgent。MotionAgent集成了大语言模型、文本生成图片模型、视频生成模型和音乐生成模型。使用MotionAgent可以通过输入创意和描述,让AI帮助生成剧本、剧照、视频和音乐。站长网2023-09-01 11:32:550000280万大模型中文开发者拿到最后一块拼图
2023年5月,微软CEO纳德拉抛出一个惊人数字,未来全球的开发者数量将会达到10亿。那时候Meta的Llama已经开源4个月,但一些国内的开发者发现,从小以英文语料喂养起来的Llama,对中文世界并不友好。这未来的“10亿”开发者里会有多少中文开发者,这个问题难以预测,但至少已经有755万人了。图源备注:图片由AI生成,图片授权服务商Midjourney站长网2023-12-01 17:47:590001迎接春晚,B站准备好了吗?
“上B站,和3亿年轻人一起看春晚。”2024年1月9日,B站首页闪现的这一句口号,瞬间在整个社区激起了阵阵涟漪。据悉,2025年春节联欢晚会,B站已经同中央广播电视总台达成了重磅合作——B站将在除夕夜全程同步直播央视春晚,并成为央视蛇年春晚的独家弹幕视频平台。0000淘宝仅退款政策突然变动!减少干预 提升商家自主权
快科技7月28日消息,据媒体报道,淘宝近期宣布对其仅退款”政策进行调整,以提升商家的售后自主权,特别是对综合体验分较高的商家。自8月9日起,新策略将正式实施,对店铺综合体验分达到4.8分及以上的商家,平台不会通过旺旺主动介入、支持收货后的仅退款,而是鼓励商家与消费者先行协商解决。对于其他体验分段的商家,平台将根据体验分和行业特性,给予不同程度的自主处置权,体验分越高,商家的处置权也越大。0000“AI孙燕姿”创作者:视频播放千万,教程月销三单
刚刚过去的“五一”假期里,许久未露面的孙燕姿,现身长沙海潮宇宙音乐节。同时期,“AI孙燕姿”在各大短视频平台走红。真人与AI在不同次元遥相呼应,孙燕姿戏剧性地成为了本与她关系不大的AI领域的主角。《漠河舞厅》(原唱:柳爽)、《发如雪》(原唱:周杰伦)等歌曲经由“AI孙燕姿”演唱,网友的评价是“重新认识了这些歌曲”。“AI孙燕姿”版《发如雪》的弹幕站长网2023-05-16 18:20:570000