中国科学院提出「思维传播」框架 让大模型能够像人类一样类比思考
站长网2023-10-10 22:14:150阅
中国科学院与耶鲁大学的研究人员共同提出了一种名为「思维传播」(Thought Propagation)的全新框架,旨在提升大型神经网络模型(如GPT-4、PaLM)的推理能力,使其能够更像人类一样进行类比思考。这个框架的灵感源自人类认知,即人们在面对新问题时常常将其与已经解决的类似问题进行比较,以推导出解决策略。

论文地址:https://arxiv.org/abs/2310.03965
「思维传播」的核心思想是让模型在解决问题之前,探索与输入问题相关的类似问题,并从类似问题的解决方案中获取启发。这一过程包括三个关键阶段:
1. 提出类似问题:模型通过提示生成与输入问题相似的一组类似问题,以引导模型检索相关的经验。
2. 解决类似问题:模型使用现有的提示技术(如CoT)来解决每个类似问题。
3. 汇总解决方案:模型可以根据类比解决方案直接推断出输入问题的新解决方案,或者通过比较类比解决方案推导出高级计划或策略。
这个框架的关键创新之处在于它能够激发模型的类比思维,引导复杂的推理过程。研究人员通过多个任务的评估验证了「思维传播」的有效性,包括最短路径推理、创意写作和LLM智能体规划任务。
在最短路径推理任务中,「思维传播」显著提高了性能,生成了最优和有效的最短路径。在创意写作任务中,「思维传播」也表现出人类更喜欢的一致性。在LLM智能体规划任务中,「思维传播」提高了任务完成率。
尽管这项研究提供了有望增强大型神经网络模型推理能力的新方法,但也存在一些挑战,如生成有用的类比问题和管理长链的类比推理路径。然而,「思维传播」为改进模型的推理能力指明了新方向,有望使大型语言模型更接近人类的推理方式。
0000
评论列表
共(0)条相关推荐
极氪汽车6月交付10620辆 同比增长146.9%
吉利控股旗下高端智能电动品牌极氪宣布,6月公司交付10620辆,同比增长146.9%,环比增长22.4%。截至目前,极氪品牌累计交付12万台。据悉,极氪品牌旗下有极氪001、极氪009、极氪X三款车型。站长网2023-07-02 10:12:390000阿里云通义千问APP上线“通义舞王”功能 一张照片即可跳科目三
阿里云通义千问APP近日上线了一项名为“通义舞王”的免费功能,使用户能够轻松地生成个性化的舞蹈视频。用户只需在通义千问APP内输入“通义舞王”或“全民舞王”等口令,然后按照提示要求上传自己的照片。系统会在十几分钟内生成一个神形兼备的舞蹈视频,保留原形象的面部表情、身材比例、服装以及背景等特征。0000拆解抖音12类博主,哪种赚钱最简单?
各位村民好,我是村长自媒体现在还能不能做?当然能!但是到底做哪种自媒体比较合适,许多人一直为此头疼。所以今天村长就为大家的简单梳理一下,在抖音最为常见的12种自媒体类型,以及分析一下它们都有哪些要求。图源备注:图片由AI生成,图片授权服务商Midjourney01美食类操作难度:一颗星业务要求:会拍摄、会跟着菜谱做菜变现方式:广告流量分成、橱窗带货变现周期:1—3个月起站长网2024-03-18 17:11:160000不要9块9「写真」零元购,妙鸭挑战者出现,可白嫖25张
妙鸭相机带爆了AIGC艺术照赛道,这不,又有新产品探头。而且还卷起来了…妙鸭还要九块九,这个工具可以免费白嫖?出于好奇我们顺藤下载了个APP,打开界面一看,果然也是上传照片生成艺术照的类型,从种类来看还挺多样。点开一个样图,乍一看还不错。和妙鸭相似的是,它同样是传图一次训练,任意生成全身复杂场景照片。但从网友反馈来看,这个最大的区别是可以免费试用,数量25张。站长网2023-08-28 18:15:030000FF推出法拉使命“Mission Farad”平台
昨日,FaradayFuture(FF)宣布推出“MissionFarad”平台(“法拉使命”)。该平台基于Web3.0技术打造,将充分联合开发者、创造者、用户和投资者,实现价值共创和收益共享。“法拉使命”将为FF用户带来更多创新体验和机会。它包括4个关键部分:开源的共创技术平台、共享的商业模式、合伙制的治理结构以及双赢的产品组合。站长网2023-05-23 08:37:470000