谷歌推创新框架AGREE 可增强大模型生成内容准确性
站长网2024-06-11 18:06:500阅
谷歌研究院推出了一个名为AGREE的创新框架,旨在增强大型语言模型(LLM)生成内容和引用的准确性。这一框架通过检索文档中的相关段落来增强大模型生成回答的事实基础,并提供相应的引用,从而提高回答的准确性,并为用户提供验证信息真实性的途径。
核心技术:
训练阶段微调:使用基础大模型生成回答,并利用自然语言推理模型(NLI)评估段落是否支持特定声明。AGREE框架使用NLI模型从未标记的查询中自动构建训练数据集,通过匹配回答和检索到的文档,为每个声明找到最相关的支持性段落。
测试时自适应:一种动态、迭代的推理增强方法,帮助大模型在面对新的内容查询时,主动从大型语料库中检索相关信息,并对生成的回答进行补充和修正。
AGREE的工作流程:
在微调阶段,AGREE框架采用LORA的轻量级微调技术,通过在大模型的权重矩阵上添加低秩更新,实现高效且针对性的调整,减少计算资源消耗,同时保持模型泛化能力。
测试时自适应从接收到新查询开始,微调后的大模型根据训练阶段学到的知识生成初步回答,然后进入自动迭代过程,自我评估并识别需要额外支持的声明。
一旦识别出需要额外信息的声明,启动检索过程,在预构建的语料库中搜索相关段落,并将这些段落与先前回答结合,生成更完善、准确的内容。
实验结果:
研究人员在Llama-2-13b等知名大模型上进行了实验,结果显示AGREE在提升内容回答准确性和引用性方面表现突出。
论文地址:https://arxiv.org/pdf/2311.09533
0000
评论列表
共(0)条相关推荐
AI创意生成器MemeCam:自动为图片加上含梗量爆棚的文字
MemeCam是一款基于人工智能技术的创意生成器,旨在帮助用户快速生成有趣的网络梗图。通过上传图片或使用相机拍摄,MemeCam利用AI算法进行图像识别和语义理解,自动生成创意搞笑的文字和贴纸,为图片增添笑点和趣味性。体验地址:https://www.memecam.io/MemeCam结合了BLIP图像识别和GPT-3.5AI驱动的字幕生成,可提供轻松有趣的梗图创建体验。站长网2023-08-08 18:03:480000领先版本!韩国低欲望社会再出现象级恋综
最近,韩国恋综的风吹到了老年群体。爷爷奶奶的恋爱劲头,可比小年轻们高多了。在《最后的爱情》里,10位50银发嘉宾齐聚浪漫的济州岛海边,开展追爱之旅,其中最高龄达到60岁。站长网2024-09-09 00:56:480000小米曾学忠:小米很快会实现端侧AI模型能力
在最近的小米年度演讲中,雷军提到了小米在AI大模型能力方面的进展。他表示,小爱同学已经正式升级生成式大模型,并且已经开始进行测试。近日,小米集团高级副总裁、手机部总裁曾学忠也透露,基于与高通和联发科的深度底层技术合作和高频沟通,小米很快会推出端侧AI大模型应用,同时,小米端侧AI大模型技术项目得到了新批的预算。站长网2023-08-17 13:54:210000微信下架重生、觉醒类多部违规微短剧:不良导向、未备案等
快科技10月13日消息,日前,微信珊瑚安全公众号发布10月违规微短剧类小程序的处置公告,多部微短剧、侵权小程序被下架。微信方面表示,近期平台通过巡查审核发现,部分微短剧类小程序存在未进行剧目合规备案、不良导向价值观内容或存在盗版侵权等行为。根据国家相关法律法规要求以及《腾讯微信软件许可服务协议》《微信小程序运营规范》的相关规定,平台下架了部分违规微短剧剧目,并对相关违规小程序进行处置。站长网2024-10-14 19:33:010000百度“萝卜快跑”获准在京开展大兴机场自动驾驶载人示范应用
百度旗下的自动驾驶服务品牌“萝卜快跑”最近宣布,他们首批获准在北京大兴机场高速和部分区域进行自动驾驶车辆载人示范应用。这意味着北京成为全球首个开展城区至机场自动驾驶载人示范应用的首都城市。这一举措表明“萝卜快跑”自动驾驶服务场景得到进一步扩展,未来将实现城区道路到机场高速的自动驾驶贯通运行,让用户能够享受无需换乘一站直达的便利。站长网2024-02-23 14:16:220000