563支AI队伍做了姜萍同一份数学试卷: 结果最高分仅34
站长网2024-06-17 01:54:330阅
快科技6月16日消息,在最近举办的阿里巴巴全球数学竞赛中,来自江苏省涟水中等专业学校的17岁女生姜萍不仅成功入围决赛,还以全球排名12的成绩成为了赛事历史上首个进入决赛的中专生。
不仅如此,今年的阿里数赛还首次开放了AI大模型挑战赛,共有563支由全球知名高校院所和企业组建的AI队伍与姜萍解答了同一份试卷。
最终AI队伍的平均分为18分,这一成绩已经接近人类选手的平均水平。但最高得分却仅为34分,与人类选手的最高分113分相差甚远,并且AI队伍在决赛中无一入围。
AI队伍中最高分由上海建平中学的涂津豪个人推出的AI方案获得,他采用了一种让多个大模型进行自问自答自验证”的方法,以寻求问题的最优解。
而西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队分别以27分的成绩位列AI挑战赛的亚军和季军。
尽管AI在数学竞赛中的表现显示出了一定的潜力,但专家分析指出,现有的大语言模型在完成复杂推理和严谨思考方面仍存在局限。
AI在逻辑推理能力和证明题的得分上表现不佳,这表明在深层次逻辑推理和创新思维方面,人类选手依然保持着明显的优势。
0000
评论列表
共(0)条相关推荐
腾讯小世界将改名QQ短视频 强化短视频产品定位
据界面新闻报道,腾讯QQ的“小世界”产品将更名为“QQ短视频”,以进一步强化其短视频的产品定位。据报道,来自QQ内部的消息人士透露,目前在整个QQ平台上,有很多用户只观看短视频而不参与聊天。这意味着小世界在QQ的活跃用户数据中占据了相当大的比例,对于腾讯来说,这是一个值得关注和利用的资源。站长网2023-12-01 14:14:450000iQOO 13首发电竞芯片Q2:将于10月30日发布
iQOO13系列手机即将在10月30日与消费者见面,这款手机不仅行业独家首发了自研的电竞芯片Q2,还带来了一系列创新特性,旨在打破电竞视效的天花板。0000华为发布全球首个商用能源行业 AI 大模型「盘古矿山大模型」
华为联合山东能源集团在今天发布会上宣布,华为盘古大模型在矿山领域实现了首次商用,解决了人工智能在矿山领域落地难的问题,引领矿山AI开发模式从作坊式向工厂式转变,为AI大规模进入矿山打下坚实基础。站长网2023-07-19 07:57:400000淘宝更新手淘搜索展示销量统计逻辑
日前,淘宝店长发布通知称,淘宝手淘搜索展示的销量统计逻辑更新。1、按综合排序搜索:为了提高消费者搜索体验,搜索侧从4月开始逐步升级手淘搜索综合排序下的销量展示逻辑,新的逻辑正在灰测中,目前共有4种展示逻辑,不同消费者看到的商品销量可能会不一样,展示逻辑如下:站长网2023-05-12 20:41:090000官宣!小米人车家全生态将亮相2024 MWC
快科技2月14日消息,近日,小米官方在海外社交平台官宣,小米人车家全生态”将亮相于2024年西班牙巴塞罗那世界移动通讯展览会(MWC)。据悉,MWC是世界移动通信大会,由移动通信亚洲大会发起,全球移动通信系统协会主办。2024年MWC展会时间是2月26日-2月29日。据官方发布海报,今年MWC展会不仅有小米SU7、小米手机、还有智能家居。站长网2024-02-14 12:51:380000