Meta研究人员提出轻量级微调方法RA-DIT 以增强语言模型知识检索能力
文章概要:
1. RA-DIT通过两阶段调优提升语言模型利用检索信息的能力和检索器提供相关结果的能力。
2. RA-DIT在知识密集的零样本和少样本学习基准测试中优于现有检索增强模型。
3. RA-DIT65B在需要利用知识的任务中表现显著提升,展现调优带来的效果。
最近,Meta的研究人员提出了一种名为检索增强双指令调优(RA-DIT)的新型人工智能方法,用于提升语言模型的知识检索能力。该方法试图解决大型语言模型在捕获较为冷门知识时的局限性以及大规模预训练的高计算成本问题。
RA-DIT是一个轻量级的两阶段微调方法,旨在为任何语言模型赋予高效的检索能力。它通过两种不同的微调方式,每种方式都能带来可观的性能提升。首先,它会优化语言模型利用检索到的信息的能力。其次,它会优化检索器提供的内容相关性,使其能够提供更符合语言模型偏好的相关结果。通过同时提升语言模型使用检索信息的效果和检索器提供内容的相关性,RA-DIT能有效地增强语言模型的知识检索能力。
图源备注:图片由AI生成,图片授权服务商Midjourney
研究人员采用了在大规模数据集上进行过预训练的LLAMA语言模型,并使用初始化为DRAGON模型的双编码器检索架构。此外,他们还提到了使用并行上下文检索增强,以更有效地计算语言模型的预测。
实验结果显示,RA-DIT65B在知识密集的零样本和少样本学习任务中设置了新的基准,大幅超过现有的上下文检索增强语言模型。这证明了轻量级指令调优在提高检索增强语言模型性能方面的效果,特别是在需要访问大量外部知识源的场景中。在需要利用知识和语境感知的任务中,RA-DIT65B的表现有了大幅提升。此外,与基础LLAMA模型相比,RA-DIT在8个常识推理评估数据集中表现更好。
RA-DIT为预训练语言模型带来了检索能力的提升。它在知识密集的零样本和少样本评估中取得了最先进的结果,超过了未调优的上下文检索增强语言模型,与大规模预训练的方法展现出竞争力。RA-DIT显著改善了对知识利用和语境感知的要求较高的任务的表现。该研究证明了轻量级指令调优对检索增强语言模型的有效性,特别是在涉及大规模外部知识源的场景中。
论文网址:https://arxiv.org/abs/2310.01352
Group-IB 在暗网市场上发现超过 10 万个 ChatGPT 帐户信息泄露:亚太地区位居榜首
今天,网络安全公司Group-IB宣布它在暗网市场上偶然发现了大量的ChatGPT帐户信息泄露。这家总部位于新加坡的公司确定了101,134台受恶意软件感染的设备,所有这些设备都包含生成式人工智能平台的登录详细信息。图片来自Group-IB站长网2023-06-22 11:06:500000AWS与NVIDIA扩大合作,提供先进的生成式AI基础设施
**划重点:**1.🌐AWS将成为首家在云上引入NVIDIAGH200GraceHopperSuperchips的云服务提供商,为联合客户提供规模化的AI计算能力。2.🤖合作包括在AWS上托管NVIDIADGXCloud,这是首个搭载GH200NVL32的云端AI培训服务,加速先进生成式AI和大型语言模型的训练。0000大厂春节礼盒走红二手平台,假期倒卖狂赚20万
又到了一年一度的春节,这也是各大互联网企业为员工展示自家福利水平,比拼企业文化的时刻。互联网大厂的新春礼盒,每年都会引发行业讨论。比如,今年字节的新春礼盒就引发出了热议。站长网2024-02-10 11:00:040001国产AI机器人好超前…弹琴泡茶打咏春,还能撸猫??
什么水平,让海外最火AI机器人Figure的CEO都第一时间关注?国产人形机器人大秀肌肉,最新技能居然是弹琴泡功夫茶……和颠勺?!手握琴竹,精准轻巧敲击每根琴弦,演奏动听音乐。熟练泡一壶功夫茶,十几道工序、数个杯壶轻松拿捏。搞定一份香喷喷的华夫饼,最后还附送一个祖传颠勺。“闲情逸致”时还能带你练练咏春,这不就是机器人版叶师傅?注意哦,以上操作都是机器人独立自主完成,原倍速展示。站长网2024-08-19 17:00:040000卢伟冰宣布小米全球首发!高通第三代骁龙8s移动平台发布
快科技3月18日消息,高通宣布推出第三代骁龙8s移动平台,为更多Android旗舰智能手机带来骁龙8系平台上最广受欢迎的特性,实现非凡的顶级移动体验。在发布会上,小米集团卢伟冰宣布,我们很高兴能与高通技术公司合作,推出首款搭载第三代骁龙8s的终端,这款全新移动平台让我们能够利用生成式AI为用户提供顶级的个性化体验。站长网2024-03-18 22:58:260000