谷歌研究:大型语言模型难以自我纠正推理错误
站长网2023-10-19 09:20:490阅
谷歌研究表明,大型语言模型在没有外部指导的情况下难以自我纠正推理错误
谷歌 DeepMind 最新研究发现,大型语言模型 (LLM) 在没有外部指导的情况下难以自我纠正推理错误。
这项研究结果对于开发更智能的语言模型具有重要意义。
在一篇名为《大型语言模型尚不能自我纠正推理》的论文中,谷歌 DeepMind 的科学家们进行了一系列实验和分析,以探究语言模型的自我纠正能力。研究人员发现,当模型试图仅仅根据自身的想法来纠正其最初的反应时,往往会出现问题。

图源备注:图片由AI生成,图片授权服务商Midjourney
此前的一些研究表明,语言模型在内部进行自我纠正是有效的。但谷歌的研究发现,这些研究在指导模型时使用了 "预言",即正确的标签。如果没有这些 "预言",模型的准确性并不会提高。
谷歌 DeepMind 的研究人员表示,为了使语言模型正常工作,它们需要具备自我纠正的能力,因为在许多现实世界的应用中,外部反馈并不总是可用的。
研究团队还尝试了一种多智能体方法,即部署多个语言模型以实现一致性响应。虽然没有一个模型能够每次都产生相同的结果,但通过投票机制,可以达成一致的响应。
然而,研究人员指出,这种改进并非真正的自我纠正,而是一种自我一致性。要使语言模型真正具备自我纠正的能力,仍需更多的研究和改进。
谷歌 DeepMind 的研究人员认为,目前对于需要更安全响应的应用程序来说,具备自我纠正能力的语言模型可能更加有效。但他们也呼吁研究人员应该保持敏锐的视角,认识到自我纠正的潜力和局限性,并努力改进现有模型。
尽管目前大型语言模型在自我纠正推理方面还存在一些挑战,但这项研究为未来的发展提供了重要的指导,让我们更好地了解和改进语言模型的能力和局限性。
0000
评论列表
共(0)条相关推荐
重磅,Meta开源“次世代”大模型Llama 2,扎克伯格:免费可商用
站长网2023-07-19 20:14:440001退出印度芯片制造了?富士康回应
凤凰网科技讯北京时间7月11日消息,在周一宣布退出价值195亿美元的印度芯片制造合资项目后,富士康在印度的布局备受关注。富士康周二发表声明,再次进行了解释。谈到公司与印度金属石油企业集团Vedanta的“分手”,富士康表示,“双方都认识到这个项目进展不够快”,而且还有其他“我们无法顺利克服的挑战性分歧”,但是“这不算负面消息”。富士康没有透露更多细节。站长网2023-07-12 11:35:340000特斯拉推出8000元限时保险补贴 Model 3焕新版售价25.34万元起
11月28日,特斯拉在其官方微博上宣布了一项优惠活动。年底前购买Model3或Y车型,可以享受高达2.1万元的优惠。此外,S3XY全系车型也有限时低息金融政策上线,通过该政策购买ModelY可以最高节省11500元。对于Model3和Y的后轮驱动版现车,特斯拉也推出了限时保险补贴,消费者可以享受8000元的福利。站长网2023-11-28 17:42:130000推特再次“强抢”用户账号!仍未给予任何补偿
快科技8月6日消息,早些时候,推特在更名X后,在没有实质补偿的前提下,强制占用了一名用户的账号@X”。现在,推特再次动手,强抢”了另一名用户经营16年的账号:@music。据悉,@music是JeremyVaught持续运营16年的账号,被用于发布各种流派的音乐新闻和表演,拥有超过50万的粉丝。站长网2023-08-06 14:09:490000报道称美国军方投资数亿美元计划发展智能无人机及AI系统
文章概要:1.美国国防部计划扩大无人机和自主系统机队,加入人工智能技术。2.国防部副部长凯瑟琳·希克斯提出发展“小型、智能、廉价”人工智能系统,以抵御威胁。3.计划包括加强监视设备和网络,尚不清楚具体应用的人工智能技术。美国国防部计划投资数百万美元,扩大其无人机和自主系统机队,并考虑引入更多的人工智能(AI)技术,以增强其军事能力。站长网2023-09-07 14:19:240000