OpenAI发布PVG:用小模型验证大模型输出,解决“黑盒”难题
7月18日凌晨,OpenAI在官网发布了最新技术研究——Prover-Verifier-Games。
随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。
为了解决这个难题,OpenAI提出了全新训练框架Prover-Verifier Games(简称“PVG”),例如,用GPT-3这样的小模型来验证、监督,GPT-4大模型的输出,从而提升输出准确率以及可控性。
OpenAI论文地址:https://cdn.openai.com/prover-verifier-games-improve-legibility-of-llm-outputs/legibility.pdf
其实PVG技术概念早在2021年8月的一篇论文中就被提出来,OpenAI也正是受此灵感启发。这是一种基于博弈论的训练方法,通过模拟证明者和验证者之间的互动,提高模型的输出质量。
在这个机制中, Prover(证明者)的任务就是生成内容,而Verifier(验证者)的任务就是判断这些内容是否正确。
论文地址:https://arxiv.org/abs/2108.12099
PVG模块的核心思想是通过多轮迭代训练,来提升证明者和验证者的整体性能。在每一轮训练中,验证者首先使用监督学习来预测从之前轮次的证明者中采样的内容的正确性。
这样做的目的是让验证者学会如何从大量的内容中识别出正确的答案。随后,证明者通过强化学习来优化其生成的内容,使其不仅正确,还能够说服验证者来接受这些内容。
在验证的过程中,证明者和验证者的角色是相互依赖的。证明者需要生成能够说服验证者的内容,而验证者则需要具备足够的判断力来识别出正确的内容。
为了进一步提升效率性,OpenAI在此基础之上又设计了两种强化类型的证明者,有用的证明者(Helpful prover)和狡猾的证明者(Sneaky prover)。
有用的证明者的目标是生成正确且有说服力的内容。它通过优化其生成的内容,使其能够被验证者接受。
而狡猾的证明者则试图生成错误但同样有说服力的内容,以此来欺骗验证者。这种设计不仅增加了训练的难度,也使得验证者必须具备更高的判断力和鲁棒性。
在训练PVG时,每轮训练都包括验证者和证明者的优化。在每一轮中,验证者首先使用监督学习来预测内容的正确性,帮助验证者学会如何从大量的内容中识别出正确的答案。使证明者通过强化学习来优化其生成的内容。
例如,当用户提出问题“肖娜的父亲是肖娜的5倍。肖娜目前的年龄是阿莉亚的3倍。如果阿莉亚3岁,肖娜的父亲有多大?”
GPT-4的输出为45岁。
而验证者模型GPT-3需要确定阿莉亚的年龄,然后根据阿莉亚的年龄计算出肖娜的年龄,最后再根据肖娜的年龄计算出肖娜父亲的年龄,整个过程需要多轮验证。
此外,在训练过程中,OpenAI还引入了一种名为“可检查性训练”(checkability training)的方法。
通过交替训练验证器和证明者模型,从而验证使用监督学习来预测从之前轮次的证明者中采样的解决方案的正确性。证明者则使用强化学习,根据当前轮次验证器的接受度和解决方案的正确性来进行持续优化。
研究人员表示,随着训练轮次的增加,验证者的健全性逐渐提升,表现为对狡猾论证者生成的错误解决方案的抵抗力增强。同时,有益论证者生成的解决方案也变得更清晰,更易于被人类理解。
不过需要注意的是,在训练验证者模型时,需要大量真实、准确的标签数据,以提升其辨别真假的能力。也就是说,如果使用的验证模型存在偏差,那么验证的内容还是会出现非法输出的可能。
教你赚钱的博主,让你赚到钱了吗?
各位村民好,我是村长每个人都想赚钱,许多人每天都在网上看各种各样的赚钱故事。包括村长本人,也经常分析各类赚钱项目、案例,但是看了这么多,你最终赚到钱了吗?或者说,为什么你看了那么多赚钱案例、文章、总结复盘,最终你还是没有赚到钱呢?今天村长就来和大家一起分享一下,为什么你没赚到钱?01文章传递的是信息不是过程我们看到的多数文章、视频在拆解案例、分享项目,大家更多的是旁观者。站长网2024-01-19 09:18:170001丢掉注意力的扩散模型:Mamba带火的SSM被苹果、康奈尔盯上了
替代注意力机制,SSM真的大有可为?为了用更少的算力让扩散模型生成高分辨率图像,注意力机制可以不要,这是康奈尔大学和苹果的一项最新研究所给出的结论。众所周知,注意力机制是Transformer架构的核心组件,对于高质量的文本、图像生成都至关重要。但它的缺陷也很明显,即计算复杂度会随着序列长度的增加呈现二次方增长。这在长文本、高分辨率的图像处理中都是一个令人头疼的问题。0000全网粉丝超4000万,“猫一杯”的互联网唠嗑记 | 新榜专访
靠唠嗑收获千万粉丝关注,是一种怎样的体验?“Thurman猫一杯”或许深有体会。从2020年4月发布第一条吐槽法国快递时效的视频开始,她几乎事无巨细地分享生活日常,吸引粉丝们与之互动,还诞生出多个花名。不管是她啃菜叶子的酷似程度被唤作“豚鼠”;还是她弄丢自己竖大拇指照片做屏保的手机,获得“广州白云机场大拇哥”的称号……这些片段在她的讲述中好笑又离谱,像是在听身边好友唠嗑聊八卦。站长网2024-01-22 14:11:250000锐步跟随 Nike 进军数字时尚和游戏领域 并加入人工智能技术
锐步与加密技术初创公司Futureverse建立了独家合作伙伴关系,旨在将锐步的品牌影响力扩展到虚拟领域,并“彻底改变数字世界的时尚”。此次合作将重点开发人工智能和区块链支持的游戏和数字体验。明年,Reebok和Futureverse将推出“ReebokImpact”,这是一种“令人心旷神怡的数字鞋体验”,它将结合人工智能技术和链上数字可穿戴设备。站长网2023-12-08 15:16:240000AI日报:豆包视频生成模型正式发布;腾讯推“养老”机器人小五;中科大推人像视频编辑神器PortraitGen
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、字节跳动豆包视频生成模型正式发布支持多镜头视频一致性生成站长网2024-09-29 12:21:090000