中国科学院提出「思维传播」框架 让大模型能够像人类一样类比思考
站长网2023-10-10 22:14:150阅
中国科学院与耶鲁大学的研究人员共同提出了一种名为「思维传播」(Thought Propagation)的全新框架,旨在提升大型神经网络模型(如GPT-4、PaLM)的推理能力,使其能够更像人类一样进行类比思考。这个框架的灵感源自人类认知,即人们在面对新问题时常常将其与已经解决的类似问题进行比较,以推导出解决策略。
论文地址:https://arxiv.org/abs/2310.03965
「思维传播」的核心思想是让模型在解决问题之前,探索与输入问题相关的类似问题,并从类似问题的解决方案中获取启发。这一过程包括三个关键阶段:
1. 提出类似问题:模型通过提示生成与输入问题相似的一组类似问题,以引导模型检索相关的经验。
2. 解决类似问题:模型使用现有的提示技术(如CoT)来解决每个类似问题。
3. 汇总解决方案:模型可以根据类比解决方案直接推断出输入问题的新解决方案,或者通过比较类比解决方案推导出高级计划或策略。
这个框架的关键创新之处在于它能够激发模型的类比思维,引导复杂的推理过程。研究人员通过多个任务的评估验证了「思维传播」的有效性,包括最短路径推理、创意写作和LLM智能体规划任务。
在最短路径推理任务中,「思维传播」显著提高了性能,生成了最优和有效的最短路径。在创意写作任务中,「思维传播」也表现出人类更喜欢的一致性。在LLM智能体规划任务中,「思维传播」提高了任务完成率。
尽管这项研究提供了有望增强大型神经网络模型推理能力的新方法,但也存在一些挑战,如生成有用的类比问题和管理长链的类比推理路径。然而,「思维传播」为改进模型的推理能力指明了新方向,有望使大型语言模型更接近人类的推理方式。
0000
评论列表
共(0)条相关推荐
春晚60万大奖得主现身 因反诈意识强险错失华为全家桶
近日,在热闹的春节氛围中,一个关于春晚60万元大奖的故事引起了广泛关注。原来,作为2024年春晚的独家互动合作平台,京东为观众准备了丰厚的奖品,其中包括华为全场景旗舰产品及问界M9的使用权,总价值高达60万元。在除夕夜的钟声敲响之际,10位幸运儿被抽中,他们将有机会获得这份难得的大奖。站长网2024-02-21 16:32:220000何小鹏:结合端到端技术和大模型最终将实现L4级别自动驾驶
小鹏汽车董事长何小鹏近日在社交媒体上发表了对特斯拉最新版全自动驾驶系统(FSD)和自动驾驶出租车(Robotaxi)的看法。站长网2024-07-25 15:29:500000AI手机,活成产业“摇钱树”
早几年出现的折叠屏没能拯救颓势的手机市场,直接证据就是去年全球出货量依旧拉胯,同比下滑3.2%至11.7亿部,为近十年来最低。好在Q4出现了些许回暖,全球和中国市场分别有8.5%和1.2%的同比增幅,尤其是后者,在连续同比下降10个季度后首次转正。很难说这其中没有AI的功劳。站长网2024-05-12 04:04:500000云从科技发布大模型公共服务平台“众寻人工智能公共服务平台”
云从科技子公司众数信科正式发布“众寻人工智能公共服务平台”,该平台是全国首个基于AI大模型面向开发者及企业服务的公共服务平台。该平台与云从从容及国内主流大模型进行了深度对接,提供了一站式大模型微调与推理能力的接入以及物美价廉的GPU云算力服务,帮助开发者将AI大模型能力集成到自有业务应用中。站长网2023-09-11 12:08:000000眼馋GPTs的人有福了,我们找到了一款不用花钱的平替
AI能替我完成工作吗?在研究AI的过程中,这个问题时常出现在我的脑海。比如关注我们的朋友应该知道,“头号AI玩家”有一个每日更新AI行业资讯的栏目「AI日报」,平时,我们的同事会轮流搜集信息进行整理编辑。这样的内容,可以让AI来帮我们完成吗?我试着用Poe做了一个新闻快讯AI机器人,来测试这一想法的可行性(至于Poe是个什么产品,我会在后文会进行解释)。站长网2023-11-13 21:47:380009