ToRA:融合自然语言推理与外部工具 数学推理能力增强
文章概要:
- 清华大学与微软合作开发的ToRA是一款革命性的工具集成推理代理,旨在通过将自然语言推理与外部计算工具结合,解决复杂数学问题。
- ToRA模型经过训练,成功在多个数学推理数据集上取得了显著的性能提升,特别是在MATHS竞赛级数据集上,表现出高精度。
- 这一研究为数学问题求解领域带来了重大突破,通过无缝集成自然语言理解和工具使用,ToRA代理在各种数学推理任务上实现了最先进的性能。
随着大型语言模型的出现,人工智能和数学问题求解领域取得了显著进展。然而,这些模型在面对复杂的数学挑战时仍然存在问题。为了解决这个问题,清华大学与微软的研究人员推出了ToRA,这是一种被称为“工具集成推理代理”的创新方法,旨在通过将自然语言推理与外部计算工具相结合,解决复杂的数学问题。
研究人员已经开始将外部工具,如计算器、代码解释器和符号求解器,集成到数学问题求解中。虽然基于程序的方法已经成功地将推理任务转化为程序合成任务,但它们仍然面临着复杂的推理、规划和错误处理问题。将大型语言模型(LLMs)与这些工具相结合显著提高了推理和生成性能。知识蒸馏技术,如LLM生成的轨迹用于微调,也在将知识从教师模型传递给学生模型方面发挥了作用。
尽管LLMs在语言任务中取得了显著进展,包括数学推理,但复杂的数学问题仍然具有挑战性。目前提高LLMs数学能力的策略包括逐步的自然语言推理和程序合成。前者在语义和抽象推理方面表现出色,而后者在严格操作中表现出色,并可以利用诸如方程求解器之类的专业工具。他们的方法在数学推理数据集上优于开源模型,在竞赛级MATHS数据集上取得了高精度。他们的方法还提供了关于工具交互的优势和未解决问题的见解,指导了该领域未来研究的方向。
ToRA模型是通过在数学数据集上使用交互式工具使用轨迹进行训练的,采用模仿学习进行注释,并通过输出空间塑造来改进推理行为。GPT-4在训练集上生成了多样化的推理模式。指导性和少样本示例以交织的格式进行组合,用于提示的策划,并评估了ToRA代理的效果,它将理性与程序相结合。这一方法取得了显著的推理性能提升。所面临的挑战包括更深入地理解几何空间以及解决中级代数和预微积分问题中的复杂符号推理。

ToRA通过将自然语言推理与外部工具相结合,增强了数学推理的能力。ToRA模型在十个数学推理数据集上表现出色,平均在程序化问题求解中超过开源模型13%-19%的绝对性能改进。他们的方法分析了工具交互的优势和挑战,突显了ToRA的工具集成推理格式的有效性,该格式将理性与程序执行相互交织。

ToRA代理代表了数学问题求解领域的重大突破,通过无缝集成自然语言理解和工具使用,它在各种数学推理任务上实现了最先进的性能,超过了现有的理性和基于程序的方法。对工具交互的优势和挑战进行的全面分析为未来的研究提供了重要见解,有望开发更先进和适应性更强的推理代理。
项目网址:https://github.com/microsoft/ToRA
小红书上线“此刻”功能 可通过AIGC能力为纯文字配图
小红书最近推出了一项新功能“此刻”,用户可以通过该功能直接输入文字,算法会根据输入的文本内容生成一张相应的图片,用户也可以在画板上手绘涂鸦,并使用AI技术对涂鸦进行美化后发布。据悉,这一功能是基于AIGC技术开发的,已经全面上线供所有用户使用。站长网2023-07-25 16:34:390000一个月涨粉超10万,B站“赛博召唤术”的风,吹到了快手和小红书
B站“赛博召唤术”的风,吹到了小红书和快手。最近,“头号AI玩家”在小红书冲浪🏄时发现,有一个叫“AI智聊”的账号频繁被网友召唤到评论区,回答五花八门的问题。Q:大盘什么时候重新回到3000点?Q:申留真(韩国演员)帅吗?Q:男朋友出🗄️了如何处理?Q:男生17岁了还没有来月经怎么办?只要在小红书评论区@AI智聊,它就能基于评论和笔记内容进行智能回复。站长网2023-11-10 14:06:470003Aria 搭载 Google Gemini:用于图像生成和语音功能
经过与GoogleCloud的合作,今日Aria宣布融入了Google的Gemini模型,为其AI浏览器带来了一次重大升级。Aria作为自家ComposerAI引擎的驱动,以其与50多个模型系列共计150多个本地LLM变体的支持而著称。而现在,加入Google的Gemini,这款先进、强大且用户友好的LLM模型,将为用户提供最新信息和卓越性能。站长网2024-05-29 17:57:590001高中老师辞职创业,公司年入34亿,上市在即
萌宠治愈孤独,撑起了千亿规模的“它经济”,也让一个又一个中国宠企站上资本市场的牌桌。宠物食品集团乖宝,自首次披露招股说明书18个月后,终于在今年6月20日获得证监会正式批复,距离在深交所挂牌上市近在咫尺。站长网2023-08-06 10:34:410001微信在深圳大学试点刷掌支付 推出“校园一掌通”服务
微信支付宣布,由微信支付、腾讯微卡团队联合深圳大学创新试点的“校园一掌通”服务正式上线,大学生们只要开通服务,就可以刷掌购物和用餐。掌心对准刷掌机上的绿色圆环,1-2秒内就能完成支付。微信支付表示,除了餐厅的刷掌消费功能外,深大的门禁刷掌服务也正在试点规划中了。站长网2023-05-31 08:33:150000