谷歌研究:大型语言模型难以自我纠正推理错误
站长网2023-10-19 09:20:490阅
谷歌研究表明,大型语言模型在没有外部指导的情况下难以自我纠正推理错误
谷歌 DeepMind 最新研究发现,大型语言模型 (LLM) 在没有外部指导的情况下难以自我纠正推理错误。
这项研究结果对于开发更智能的语言模型具有重要意义。
在一篇名为《大型语言模型尚不能自我纠正推理》的论文中,谷歌 DeepMind 的科学家们进行了一系列实验和分析,以探究语言模型的自我纠正能力。研究人员发现,当模型试图仅仅根据自身的想法来纠正其最初的反应时,往往会出现问题。
图源备注:图片由AI生成,图片授权服务商Midjourney
此前的一些研究表明,语言模型在内部进行自我纠正是有效的。但谷歌的研究发现,这些研究在指导模型时使用了 "预言",即正确的标签。如果没有这些 "预言",模型的准确性并不会提高。
谷歌 DeepMind 的研究人员表示,为了使语言模型正常工作,它们需要具备自我纠正的能力,因为在许多现实世界的应用中,外部反馈并不总是可用的。
研究团队还尝试了一种多智能体方法,即部署多个语言模型以实现一致性响应。虽然没有一个模型能够每次都产生相同的结果,但通过投票机制,可以达成一致的响应。
然而,研究人员指出,这种改进并非真正的自我纠正,而是一种自我一致性。要使语言模型真正具备自我纠正的能力,仍需更多的研究和改进。
谷歌 DeepMind 的研究人员认为,目前对于需要更安全响应的应用程序来说,具备自我纠正能力的语言模型可能更加有效。但他们也呼吁研究人员应该保持敏锐的视角,认识到自我纠正的潜力和局限性,并努力改进现有模型。
尽管目前大型语言模型在自我纠正推理方面还存在一些挑战,但这项研究为未来的发展提供了重要的指导,让我们更好地了解和改进语言模型的能力和局限性。
0000
评论列表
共(0)条相关推荐
世界品牌实验室2023年世界品牌500强发布:华为排中国第五
由世界品牌实验室独家编制的2023年度《世界品牌500强》排行榜于12月13日在美国纽约揭晓。美国在500强中占据193席,稳居品牌大国第一。法国、中国、日本和英国为世界品牌大国的第二阵营。值得注意的是,中国品牌入选数(48个)首次超越日本(43个),跃居全球第三。0002苹果份额超7成!2023全球高端手机销量创历史新高
快科技1月2日消息,今天,市场研究机构CounterpointResearch发布了2023年高端手机(批发价超过600美元、约4281元人民币)销量报告,苹果占据了超过70%的市场份额。报告显示,与今年全球智能手机市场整体的预计下降相比,2023年全球高端智能手机市场销售额可能会同比增长6%,创下新的历史纪录。站长网2024-01-02 21:58:420001苹果日砸百万,豪赌2000亿参数Apple GPT!疯狂挖角谷歌,打造核弹级iPhone
【新智元导读】曾经怀疑LLM能干什么用的苹果高管,如今急了。苹果一天烧几百万美元,只为把AppleGPT塞进明年发布的iPhone里。苹果急了?据TheInformation报道,为了加速开发LLM,苹果现在不仅大幅增加了研究经费——每天烧掉数百万美元,还从谷歌挖来了许多工程师。对此,苹果员工一致认为,他们的AppleGPT大模型能力已经超过了GPT-3.5。站长网2023-09-08 09:12:510000作业帮推出 AI 老师一对一学习机 售价 2699 元起
作业帮日前举办学习机新品发布会,推出行业首款AI老师一对一学习机。据介绍,该学习机可以从摸底测试、制定计划、全程跟练、督促学习四个环节,引导学生基于AI大数据制定的一对一学习方案进行有针对性的学习。站长网2023-04-26 10:15:480000摩根士丹利:受益于人工智能推动 Adobe 股价有望继续上涨 25%
根据摩根士丹利的分析师KeithWeiss的观点,Adobe公司的股价还有望继续上涨,他预计该创意软件制造商的股价将在未来一年内上涨25%。今年,Adobe股价已经上涨了60%以上,受到人工智能战略前景的乐观情绪的推动。Weiss的最新目标价位为660美元,接近其2021年创纪录的688.37美元。站长网2023-08-01 16:32:310000