谷歌研究:大型语言模型难以自我纠正推理错误

站长网2023-10-19 09:20:491阅

谷歌研究表明，大型语言模型在没有外部指导的情况下难以自我纠正推理错误

谷歌 DeepMind 最新研究发现，大型语言模型（LLM）在没有外部指导的情况下难以自我纠正推理错误。

这项研究结果对于开发更智能的语言模型具有重要意义。

在一篇名为《大型语言模型尚不能自我纠正推理》的论文中，谷歌 DeepMind 的科学家们进行了一系列实验和分析，以探究语言模型的自我纠正能力。研究人员发现，当模型试图仅仅根据自身的想法来纠正其最初的反应时，往往会出现问题。

图源备注:图片由AI生成，图片授权服务商Midjourney

此前的一些研究表明，语言模型在内部进行自我纠正是有效的。但谷歌的研究发现，这些研究在指导模型时使用了 "预言"，即正确的标签。如果没有这些 "预言"，模型的准确性并不会提高。

谷歌 DeepMind 的研究人员表示，为了使语言模型正常工作，它们需要具备自我纠正的能力，因为在许多现实世界的应用中，外部反馈并不总是可用的。

研究团队还尝试了一种多智能体方法，即部署多个语言模型以实现一致性响应。虽然没有一个模型能够每次都产生相同的结果，但通过投票机制，可以达成一致的响应。

然而，研究人员指出，这种改进并非真正的自我纠正，而是一种自我一致性。要使语言模型真正具备自我纠正的能力，仍需更多的研究和改进。

谷歌 DeepMind 的研究人员认为，目前对于需要更安全响应的应用程序来说，具备自我纠正能力的语言模型可能更加有效。但他们也呼吁研究人员应该保持敏锐的视角，认识到自我纠正的潜力和局限性，并努力改进现有模型。

尽管目前大型语言模型在自我纠正推理方面还存在一些挑战，但这项研究为未来的发展提供了重要的指导，让我们更好地了解和改进语言模型的能力和局限性。

谷歌研究大型语言模型难以自我纠正推理错误

0001

评论列表

共(0)条

相关推荐

站长资讯
OpenAI 敦促联邦法官驳回一起诽谤诉讼
人工智能公司OpenAI要求联邦法官驳回电台主持人MarkWalters的诽谤诉讼。诉讼围绕着聊天机器人ChatGPT向记者FredRiehl提供的虚假信息展开。OpenAI在上周提交的文件中表示，ChatGPT向Riehl传递的错误信息并不构成诽谤。OpenAI认为，作为一个AI语言模型，ChatGPT没有故意欺骗或恶意的能力，这是构成诽谤的必要要素。
站长网2023-07-25 17:30:07
0000
站长资讯
视频号到大声谈钱的时候了
最近，资深从业者欧阳（化名）决定从某头部MCN机构离职，投身视频号开始新的创业。在他看来，视频号的红利期只剩不到一年，需要抓紧了。但与此同时，不少从业者认为，因为基建不完善、流量不精准、方法难掌握、用户老龄化等问题，视频号仍处于早期阶段，还需要继续观望。
站长网2023-09-20 17:53:49
0000
站长资讯
Anthropic公布AI人工智能安全级别ASL系统
Anthropic创始人DarioAmodei在英国人工智能安全峰会上介绍了该公司提出的负责任扩张政策（ResponsibleScalingPolicy，RSP）。该政策旨在确保人工智能系统的安全性和可控性，防止潜在的风险和滥用。RSP包括两个主要组成部分:ASL系统和缩放曲线。
站长网2023-11-03 09:09:11
0002
站长资讯
报告：预计到2025年，AI PC将占全球PC出货量的40%
划重点:⭐Canalys最新预测显示，到2025年，AIPC将占全球PC出货量的40%。⭐AIPC的快速普及将推动PC市场的价值增长，带来更好的用户体验和高端化趋势。⭐Canalys提出AIPC将对整个行业产生深远影响，为厂商和合作伙伴带来巨大的价值收益。
站长网2024-03-20 12:01:33
0000
站长资讯
微信PC端更新！终于可以多开文章了，超爽？
本文转载自运营公举小磊磊（公众号ID:gongjulei），免费阅读200万字新媒体运营知识，提升新媒体运营能力。教你自媒体怎么做，快速起号赚钱。细心的新媒体人应该发现，前几天微信又更新了!PC客户端微信发生了很大变化，最主要是微信文章支持多开浏览了!绝对能提高现在的工作效率。在PC端打开任意一篇微信文章，出现弹窗，顶部会显示公众号LOGO和文章标题，不过要注意的是LOGO是无法点击的。
站长网2023-05-22 09:17:57
0000