Meta研究人员提出轻量级微调方法RA-DIT 以增强语言模型知识检索能力
文章概要:
1. RA-DIT通过两阶段调优提升语言模型利用检索信息的能力和检索器提供相关结果的能力。
2. RA-DIT在知识密集的零样本和少样本学习基准测试中优于现有检索增强模型。
3. RA-DIT65B在需要利用知识的任务中表现显著提升,展现调优带来的效果。
最近,Meta的研究人员提出了一种名为检索增强双指令调优(RA-DIT)的新型人工智能方法,用于提升语言模型的知识检索能力。该方法试图解决大型语言模型在捕获较为冷门知识时的局限性以及大规模预训练的高计算成本问题。
RA-DIT是一个轻量级的两阶段微调方法,旨在为任何语言模型赋予高效的检索能力。它通过两种不同的微调方式,每种方式都能带来可观的性能提升。首先,它会优化语言模型利用检索到的信息的能力。其次,它会优化检索器提供的内容相关性,使其能够提供更符合语言模型偏好的相关结果。通过同时提升语言模型使用检索信息的效果和检索器提供内容的相关性,RA-DIT能有效地增强语言模型的知识检索能力。
图源备注:图片由AI生成,图片授权服务商Midjourney
研究人员采用了在大规模数据集上进行过预训练的LLAMA语言模型,并使用初始化为DRAGON模型的双编码器检索架构。此外,他们还提到了使用并行上下文检索增强,以更有效地计算语言模型的预测。
实验结果显示,RA-DIT65B在知识密集的零样本和少样本学习任务中设置了新的基准,大幅超过现有的上下文检索增强语言模型。这证明了轻量级指令调优在提高检索增强语言模型性能方面的效果,特别是在需要访问大量外部知识源的场景中。在需要利用知识和语境感知的任务中,RA-DIT65B的表现有了大幅提升。此外,与基础LLAMA模型相比,RA-DIT在8个常识推理评估数据集中表现更好。
RA-DIT为预训练语言模型带来了检索能力的提升。它在知识密集的零样本和少样本评估中取得了最先进的结果,超过了未调优的上下文检索增强语言模型,与大规模预训练的方法展现出竞争力。RA-DIT显著改善了对知识利用和语境感知的要求较高的任务的表现。该研究证明了轻量级指令调优对检索增强语言模型的有效性,特别是在涉及大规模外部知识源的场景中。
论文网址:https://arxiv.org/abs/2310.01352
Win11今年被微软弃用功能达16项:含Cortana、写字板等
快科技12月17日消息,2023年即将结束,近日有媒体盘点了微软在今年宣布弃用的16项Windows11功能,一起来看下吧。Cortana小娜助手:微软现在正大力推进新的Copilot,而作为与苹果Siri和谷歌等语音助手竞争的产品,Cortana助手曾被微软寄予了厚望,但最终也难逃被放弃的结果。0001李斌:蔚来自研芯片一颗顶英伟达四颗
快科技4月21日消息,据媒体报道,蔚来李斌近日表示,去年购买了很多的英伟达芯片,这耗费了公司不少钱,为此公司转向自研芯片,因为一颗芯片可以顶四颗,所以能降低成本。据资料显示,在2023蔚来日上,蔚来正式发布了首颗自研智能驾驶芯片神玑NX9031。蔚来李斌表示,蔚来的目标是用一颗自研芯片实现目前业界四颗旗舰智能驾驶芯片的性能,使得效率和成本更优。0000西门子与阿里云合作 借助通义大模型优化Xcelerator体验
昨日,西门子与阿里云签署战略合作协议,双方将发挥在各自领域的技术优势,共同推动云计算、AI大模型与工业等不同场景的融合。根据协议,阿里云正式成为开放式数字商业平台西门子Xcelerator的生态合作伙伴,双方将基于西门子Xcelerator与“通义大模型”,共同探索人工智能在工业等多场景的应用与创新,加速数字化转型。站长网2023-06-30 19:25:030000报道称以色列军队开始用AI锁定空袭目标
以色列国防军(IDF)开始使用人工智能选择空袭目标和组织战时后勤工作,以应对占领领土和与敌对国家伊朗的紧张局势。IDF现在使用一个人工智能推荐系统来处理大量数据,选择空袭目标。另一个名为FireFactory的人工智能模型可以快速组织空袭行动,计算弹药装载量,为飞机和无人机分配和安排数千个目标,并提出时间表。站长网2023-07-18 08:52:070000AI搜索引擎Perplexity.ai估值达10亿美元并发布新的企业产品
划重点:⭐️Perplexity.ai近期完成一轮融资,估值达数十亿美元,引领AI搜索引擎领域⭐️推出企业服务“EnterprisePro”,旨在提高工作场所搜索的准确性和效率⭐️部分功能包括增强数据隐私、改善安全性、用户管理、SOC2认证、数据存储和单一登录(SSO)站长网2024-04-26 22:26:050000