谷歌推数学几何模型Alpha Geometry 解题能力接近奥数金牌选手
站长网2024-01-18 14:39:421阅
谷歌推出了新的面向数学几何领域的模型 Alpha Geometry,数学几何能力已接近人类奥林匹克金牌选手的水平。特别值得一提的是:它的训练是基于合成数据而不是现有的数据。
它训练的方式很有特别:先初始生成了十亿个随机几何图形,并全面分析了每个图形中点和线的所有关系。AlphaGeometry 找出了每个图形中所有的证明,并反向追溯出为得到这些证明所需添加的额外几何元素(如果有的话)。

按照谷歌的说法,AlphaGeometry 结合了神经语言模型和符号演绎引擎的优势,形成了一个神经符号系统。这个系统能够共同工作,为复杂的几何定理找到证明。就像“快速思考和慢速思考”理论中所述,一个系统快速提供“直觉”式的想法,而另一个则负责更谨慎、理性的决策。
语言模型擅长快速识别数据中的常规模式和关系,能够迅速预测可能有用的结构,但它们通常缺乏严谨的推理能力和解释决策的能力。而符号演绎引擎则基于正规逻辑,使用明确的规则来得出结论。这些引擎是理性的、可解释的,但在单独处理大型复杂问题时可能显得“慢”且不够灵活。
简单来说就是大语言模型快速思考提出各种可能(包括幻觉)——大胆假设,推理引擎负责慢思考对快速思考的结果进行推理验证——小心求证。
具体到下图这样的一个几何题的例子,大语言模型提出方案,推理引擎验证,验证不通过就继续改进方案或者提出新方案,直到找到最终解决方案。

这无疑将为未来人工智能的发展,尤其是对于解决大语言模型幻觉和语料不足的问题提供新的思路。
0001
评论列表
共(0)条相关推荐
腾讯:文件传输助手大家放心用 服务器不会保存微信聊天记录!
快科技8月7日消息,今天腾讯公开回应称,文件传输助手大家放心用,服务器不会保存微信聊天记录。之前,国家安全部公众号介绍,文件传输助手”能够实现文件云端存储,在不同设备终端均可下载使用,殊不知涉密文件上传网络后,电脑和手机设备自动同步与存储的过程大大增加了境外间谍情报机关通过木马病毒获取相关文件的风险。传输软件公司后台也能轻易获取涉密文件,且无法有效控制知悉范围,极易造成失泄密。0000国庆假期,消失的网红城市
火热的十一长假已经接近尾声,但奇怪的是,今年的长假却很少能看到网红城市爆火的身影。《百度地图2024年十一假期出行锦囊》数据显示,杭州千岛湖、阿坝四姑娘山为国内热门景区TOP10,甘肃甘南、云南腾冲为全国小众旅游城市TOP10。图源:《百度地图2024年十一假期出行锦囊》不少过去蹿红的网红城市,在今年国庆假期客流量虽有所增长,但和巅峰时期相比仍有很大差距。站长网2024-10-09 03:33:270000AI+医疗新势力:Shimmer在线平台为ADHD患者提供专业辅导 吸引220万美元投资
近日,由YC孵化的小众领域公司Shimmer宣布成功完成220万美元的种子轮融资,由WorklifeVentures和SeedtoBCapital共同领投。Shimmer是一家致力于为成年多动症(ADHD)患者提供实时专业辅导的在线平台,通过AI技术和人际互动,帮助会员制定并实现个人和职业目标,改善生活质量。站长网2024-01-18 10:48:400000数字人的AB面:在元宇宙中过气,在AIGC中重生
“29800元一年的虚拟主播,号称24小时不停播,月入十几万,实际上却是关键词都不能回复,播了半个月,直播间还因违规被快手封禁,最终投诉无门、退款无果。”2023年4月18日,张明(化名)在抖音看到的数字人直播的宣传视频后,激情下单用在自己的直播间带货,结果“黄粱一梦”,GMV没见增长,自己却成了头号“韭菜”。图源:网络站长网2023-06-15 19:51:430000没有大招的火山引擎,拿下70%大模型玩家
有没有在开发大模型?在学习。什么时候发布大模型?没计划。当被问起自研大模型,字节跳动副总裁杨震原口风甚严。但席卷全球的这场大模型竞逐战,没有人会主动放弃阵地。最新线索,在上海露出端倪。火山引擎对外的最新技术、产品发布动作中,我们发现:炼大模型的基础设施,不仅已经在字节内部运转,还到了能够对外输出“技术秘籍”的阶段。直观的数字,更能说明情况:站长网2023-04-20 08:58:030002