小红书提出创新框架:充分利用负样本提升大语言模型推理能力
要点:
小红书搜索算法团队在AAAI2024上提出了一种创新框架,利用负样本知识来提升大语言模型(LLMs)的推理能力。
他们设计了一个模型专业化框架,包括负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,全面利用负样本在知识蒸馏中的关键作用。
该框架通过在训练和推理过程中充分利用负样本,使得小模型能够更好地处理复杂的数学推理问题,避免大模型的黑盒属性和庞大参数量的限制。
在AAAI2024上,小红书搜索算法团队推出了一项创新框架,旨在解决大语言模型(LLMs)在推理任务中的黑盒属性和庞大参数量带来的问题。传统研究方法主要关注正样本,而这项工作强调了负样本在知识蒸馏中的价值。通过负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,他们构建了一个全方位利用负样本的模型专业化框架。
论文地址:https://arxiv.org/pdf/2312.12832.pdf
首先,他们提出了负向协助训练(NAT)方法,通过设计dual-LoRA结构,从正向和负向两方面获取知识。这一步骤在训练中动态地集成正、负LoRA模块的知识,以构建更全面的推理能力。其次,他们设计了负向校准增强(NCE),利用负知识来帮助自我增强过程,通过KL散度来度量正、负推理链路之间的不一致性,以选择性地学习和增强嵌入的知识。
除了训练阶段,他们还在推理过程中利用负向信息,提出了动态自洽性(ASC)方法,通过排序模型在正、负样本上进行训练,为正确答案的推理链路分配更高的权重。整体来说,这一框架通过充分挖掘负样本的宝贵信息,使得小模型能够更有效地进行复杂的算术推理,从而在实际应用中更广泛地部署大语言模型的推理能力。
这一研究为提高大语言模型应用性能提供了新思路,通过引入负样本的知识,弥补了传统研究方法的不足,为推理任务的应用提供了更可靠和高效的解决方案。
ULTRA:知识图谱推理的预训练基础模型
要点:1.ULTRA是一个用于知识图谱(KGs)推理的预训练基础模型,能够在各种KGs上学习通用和可迁移的图表示,甚至在零样本情况下表现出色。2.该研究团队提出ULTRA模型,旨在学习多用途的图表示,与基于文本的方法不同,无需依赖文本信息,还强调实验中使用的数据集类型,包括传导和归纳数据集。站长网2023-10-31 10:22:320001我国新能源汽车面临的风险【点击下面的音频文件】
近几年,有几组关于中国汽车的数据值得我们注意:一是2022年,中国汽车全年出口311万辆,超越德国,成为仅次于日本的全球第二大汽车出口国。二是根据中国海关总署数据,2023年一季度,中国在汽车出口量上已经超越了日本,成为世界第一大汽车出口国。海关总署数据显示,今年一季度,我国新能源汽车出口24.8万辆,同比增长1.1倍。因此可以说,我国在2023年汽车强势增长主要是新能源汽车的强势增长。站长网2023-05-24 21:34:200000腾讯追加捐赠1亿元 驰援抗汛救灾
据腾讯官方消息,8月2日,腾讯基金会追加抗汛救灾捐赠资金1亿元。捐赠资金将用于响应受灾地区紧急援助需求、过渡安置、灾后重建、复工复产、困难群众保障等工作。据悉,此前,腾讯基金会已联动多家机构开展救灾行动,启动常态备灾资金近700万元,用于清理淤沙、环境恢复、转运安置等。站长网2023-08-02 15:31:500000含AI量爆表,夸克AI搜索有哪些隐藏玩法?
最近,我在更新完夸克后,发现搜索框上方突然冒出来一排“老相识”。AI写作、文档总结、视频总结……这是把我平时常用的AI功能整合到了一起的节奏啊。不仅如此,夸克底部的导航栏还多了一个新Tab,点进去一看,是个名为“CueMe”的智能助手。这名字起得也是挺巧妙的,大概意思是有问题随时可以cue它。站长网2024-07-13 10:42:010000你用过么?闲鱼宣布用户数已突破5亿
快科技5月23日消息,今天,闲鱼官方召开2023产品升级发布会,会上,闲鱼公布了多项平台数据。根据官方公布数据,截至目前,闲鱼的用户数已经突破5亿,其中95后的比例占到了43%,00后的比例则占到了22%。由此来看,闲鱼目前的社区氛围高度年轻化,大量仍在学校或刚出社会的年轻人,会将闲鱼作为主要的二手交易平台。这一点也充分展现在了闲鱼的热点交易内容上。站长网2023-05-23 22:07:310000