Meta提出CoVe提示工程方法 减少ChatGPT等聊天机器人幻觉问题
划重点:
💡 Meta提出了链式验证(Chain-of-Verification,简写CoVe)方法,让聊天机器人根据初步回复自我生成验证问题,从而减少错误信息。
📊 CoVe可将列表式问题的准确度提高一倍以上,即使长文本的事实准确性也可提高28%。
🔮 未来可结合外部知识提升CoVe效果,如让聊天机器人访问外部数据库回答验证问题。
近日,Meta AI研究人员提出了一种新的基于提示的方法,称为链式验证(Chain-of-Verification,简写CoVe),可显著减少ChatGPT等语言模型产生的错误信息。
研究显示,ChatGPT和其他语言模型会重复复制不正确的信息,即使它们已经学到了正确的信息。Meta AI的研究人员发现,让聊天机器人根据其最初的回复自行生成验证问题,然后独立执行这些问题而不受最初输入的影响,可以减少语言模型的“幻想”。
具体来说,在CoVe方法中,聊天机器人首先响应诸如“Name some politicians who were born in New York”之类的提示,根据这个常包含错误的初始输出,语言模型随后生成诸如“Where was Donald Trump born?”之类的问题来验证其语句。这些“验证问题”然后作为一个新的提示执行,独立于第一个输入,以防止从第一个输出中获取不正确信息。然后,语言模型会根据分别收集的事实来验证第一个输入。所有测试都是在Llama65B模型上进行的。
在他们的测试中,Meta 团队还可以证明指令调整和思维链提示不会减少幻觉,因此带有 CoVe 的 Llama65B 击败了更新的指令调整模型 Llama2。在较长的内容中,使用 CoVe 的模型也优于 ChatGPT 和PerplexityAI,后者甚至可以为其世代收集外部事实。Cove 完全利用模型中存储的知识来工作。
研究团队展示了,利用CoVe方法,单个问题的答案包含的错误显著减少,从而可以显著改进最终的提示输出。对于政治家示例中的列表式问题,CoVe可将准确度提高一倍以上,大大降低错误率。对于更复杂的问答场景,该方法仍可带来23%的改进。即使对于长文本,CoVe也可将事实准确性提高28%。但是对于更长的内容,团队也需要检查验证答案的不一致之处。
未来,这种方法可以通过整合外部知识来改进,例如允许语言模型通过访问外部数据库来回答验证问题。总Meta的研究为减少类似ChatGPT等对话系统中的错误信息提供了新的思路。
刘强东内部狼性训话流出:拼搏者留 懒散者去
站长之家(ChinaZ.com)5月27日消息:在5月24日的线上讲话中,刘强东不仅宣布了为全体采销人员涨薪20%至100%的重大决定,更进行了一场深入的“狼性训话”。他强调,京东的快速发展和卓越业绩,并非建立在员工“躺着睡大觉”的基础上。站长网2024-05-27 15:07:230000微信鸿蒙原生版来了!腾讯张军:内测邀请随机向部分用户推送
快科技10月8日消息,今日,华为纯血版鸿蒙HarmoneyOSNext开启公测,首批公测机型包括华为Mate60系列、华为MateX5系列、华为MatePadPro13.2英寸系列。大家最关心的微信鸿蒙原生版也有了最新进展,据腾讯方面介绍,微信鸿蒙原生版今天开始邀请内测,已经升级HarmonyOSNEXT的用户可在收到邀请后抢先体验。用户如何获得微信鸿蒙原生版邀请资格?0000欧盟批准微软收购动视暴雪 但 Azure 云服务面临反垄断调查
欧盟行政机构欧洲委员会已批准微软公司以687亿美元收购动视暴雪公司的计划。今天早上公开了这一决定。此外,彭博社发布了一份报告,揭示欧盟正在对微软的公共云平台Azure进行非正式调查。人们认为,这个调查有可能升级为正式的反垄断调查。今年年初,微软宣布计划收购世界上最大的视频游戏开发商之一动视暴雪。随后,欧盟对这一交易展开了反垄断调查。去年11月,官员将调查扩大为所谓的第二阶段调查。0000每月1.6亿流量还在涨,人类社交行为正在被AI改变?
Characater.ai网站每日活跃用户超350万,很多用户在过去一年向其发送了超千万条消息,Characater.ai,似乎正在悄悄改变人类和AI的关系,不能再被简单定义为偏工具属性的对话机器人。Character.ai,也被大家亲切地称为C.ai,人们在做AI类产品盘点的时候常会提及,但其实大多时候只是将其作为“AI对话产品”的代表,或者说AI互动的头部产品之一。站长网2024-02-01 09:13:110000小米澎湃OS 2曝光:主攻方向是AI
快科技8月3日消息,博主数码闲聊站爆料,{tag_keyurl_2}2新系统的主攻方向是AI,这次澎湃OS将会在全场景贯彻落地AI功能。目前AI功能已在澎湃OS上线,比如小米14Ultra首发的AI大模型计算摄影平台XiaomiAISP。站长网2024-08-04 09:30:100000