全新推理框架SymbCoT 让大模型实现类人的符号逻辑推理能力
新加坡国立大学联合加州大学圣芭芭拉分校与奥克兰大学的研究人员提出了一种名为SymbCoT(Symbolic Chain-of-Thought)的全新推理框架,旨在提升大语言模型(LLMs)的符号逻辑推理能力。这一框架结合了符号化逻辑表达式与思维链,极大提升了推理的质量、鲁棒性与可信度。SymbCoT框架已被ACL2024录用。

SymbCoT框架包含四个主要部分:翻译、规划、执行和验证。翻译模块将逻辑推理任务中的前提和结论翻译成符号化表达;规划模块根据自然语言与符号化表达生成逻辑推理计划;执行模块遵循逻辑推理规则验证结论的逻辑正确性;验证模块通过对比翻译前后的语义信息,验证翻译和执行过程中是否存在错误。
实验结果表明,SymbCoT在三个复杂逻辑推理数据集上的表现均优于传统思维链(CoT)和使用外部推理工具的方法。具体来说,在GPT3.5-turbo和GPT-4上,SymbCoT的性能分别提升了22.08%、9.31%和7.88%。此外,SymbCoT在复杂场景推理、可信度和鲁棒性方面也优于现有方法。
论文地址:https://arxiv.org/pdf/2405.18357
项目地址:https://github.com/Aiden0526/SymbCoT
SymbCoT的优势在于:
复杂推理能力:SymbCoT在处理更深层次推理问题时表现更佳。
鲁棒性:SymbCoT在执行符号表达式语法时的成功率显著提高,显示出对语法错误的鲁棒性。
可信的逻辑推理:与传统CoT相比,SymbCoT基于严密的逻辑推理和验证,有效消除了过程中的不可信因素。
符号与自然语言混合表达:SymbCoT通过结合符号和自然语言表达来纠正翻译错误并增强逻辑推理的有效性。
不同LLM的影响:SymbCoT与更先进的模型(如GPT-4)之间的协同效应更为显著。
CMA松口,微软终于能将动视暴雪“娶回家”了
折腾了一年多时间的微软收购动视暴雪终于落下了帷幕,当地时间9月22日,英国竞争和市场管理局(CMA)方面宣布,动视暴雪向育碧出售云游戏版权解决了此前的担忧,并为这一交易获得批准打开了大门。目前CMA虽然还对新协议存在有限的担忧,但微软方面也提出了临时补救措施,大概率能够解决这些问题。站长网2023-10-01 21:51:120001靠聊天记录占据7月情感赛道榜首,视频号新的流量密码诞生?
你有过这样的经历吗?为了把事情说清楚,直接截图聊天记录或者合并转发聊天记录给朋友?或者说,看到别人发给你的聊天记录,一定仔仔细细看清楚上面的对话?聊天记录本是扁平化的存在,但现在有人把它做成了视频。站长网2023-08-09 17:01:160000抖音为虚拟人直播立规矩!AI生成内容监管正当时
最近,随着ChatGPT的大热,另一个词也频繁出现在大众视野——AIGC。AIGC是一种使用人工智能技术生成内容的方法,它被视为继UGC和PGC之后的新兴内容生产方式。然而任何技术的出现都是一把双刃剑,在人工智能技术使内容生产更加方便时,AIGC生成内容以假乱真、数据泄露以及侵权的风险被进一步放大。数字应用场景的多元化,也给监管体系带来更为复杂的法律挑战。站长网2023-05-10 18:13:57000161.5T内存挑战英伟达!8枚芯片撑起3个GPT-4,华人AI芯片独角兽估值365亿
高端GPU持续缺货之下,一家要挑战英伟达的芯片初创公司成为行业热议焦点。8枚芯片跑大模型,就能支持5万亿参数(GPT-4的三倍)。这是独角兽企业SambaNova刚刚发布的新型AI芯片SN40L——型号中40代表是他们第四代产品,L代表专为大模型(LLM)优化:高达1.5T的内存,支持25.6万个token的序列长度。站长网2023-09-22 15:37:020000韩国流行音乐厂牌HYBE利用AI技术6种语言发行歌曲
以BTS防弹少年团而闻名的韩国最大流行音乐厂牌利用人工智能技术,将韩国歌手的声音与其他五种语言的母语演唱者的声音融合在一起,以解决语言障碍问题。该技术使韩国最大的音乐公司HYBE(352820.KS)在5月份以韩文、英文、西班牙文、中文、日文、越南文等6种语言发行了歌手MIDNATT的歌曲。站长网2023-07-20 16:55:590001