登陆注册
17917

谷歌推数学几何模型Alpha Geometry 解题能力接近奥数金牌选手

站长网2024-01-18 14:39:421

谷歌推出了新的面向数学几何领域的模型 Alpha Geometry,数学几何能力已接近人类奥林匹克金牌选手的水平。特别值得一提的是:它的训练是基于合成数据而不是现有的数据。

它训练的方式很有特别:先初始生成了十亿个随机几何图形,并全面分析了每个图形中点和线的所有关系。AlphaGeometry 找出了每个图形中所有的证明,并反向追溯出为得到这些证明所需添加的额外几何元素(如果有的话)。

按照谷歌的说法,AlphaGeometry 结合了神经语言模型和符号演绎引擎的优势,形成了一个神经符号系统。这个系统能够共同工作,为复杂的几何定理找到证明。就像“快速思考和慢速思考”理论中所述,一个系统快速提供“直觉”式的想法,而另一个则负责更谨慎、理性的决策。

语言模型擅长快速识别数据中的常规模式和关系,能够迅速预测可能有用的结构,但它们通常缺乏严谨的推理能力和解释决策的能力。而符号演绎引擎则基于正规逻辑,使用明确的规则来得出结论。这些引擎是理性的、可解释的,但在单独处理大型复杂问题时可能显得“慢”且不够灵活。

简单来说就是大语言模型快速思考提出各种可能(包括幻觉)——大胆假设,推理引擎负责慢思考对快速思考的结果进行推理验证——小心求证。

具体到下图这样的一个几何题的例子,大语言模型提出方案,推理引擎验证,验证不通过就继续改进方案或者提出新方案,直到找到最终解决方案。

这无疑将为未来人工智能的发展,尤其是对于解决大语言模型幻觉和语料不足的问题提供新的思路。

0001
评论列表
共(0)条