小红书提出创新框架:充分利用负样本提升大语言模型推理能力
要点:
小红书搜索算法团队在AAAI2024上提出了一种创新框架,利用负样本知识来提升大语言模型(LLMs)的推理能力。
他们设计了一个模型专业化框架,包括负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,全面利用负样本在知识蒸馏中的关键作用。
该框架通过在训练和推理过程中充分利用负样本,使得小模型能够更好地处理复杂的数学推理问题,避免大模型的黑盒属性和庞大参数量的限制。
在AAAI2024上,小红书搜索算法团队推出了一项创新框架,旨在解决大语言模型(LLMs)在推理任务中的黑盒属性和庞大参数量带来的问题。传统研究方法主要关注正样本,而这项工作强调了负样本在知识蒸馏中的价值。通过负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤,他们构建了一个全方位利用负样本的模型专业化框架。
论文地址:https://arxiv.org/pdf/2312.12832.pdf
首先,他们提出了负向协助训练(NAT)方法,通过设计dual-LoRA结构,从正向和负向两方面获取知识。这一步骤在训练中动态地集成正、负LoRA模块的知识,以构建更全面的推理能力。其次,他们设计了负向校准增强(NCE),利用负知识来帮助自我增强过程,通过KL散度来度量正、负推理链路之间的不一致性,以选择性地学习和增强嵌入的知识。
除了训练阶段,他们还在推理过程中利用负向信息,提出了动态自洽性(ASC)方法,通过排序模型在正、负样本上进行训练,为正确答案的推理链路分配更高的权重。整体来说,这一框架通过充分挖掘负样本的宝贵信息,使得小模型能够更有效地进行复杂的算术推理,从而在实际应用中更广泛地部署大语言模型的推理能力。
这一研究为提高大语言模型应用性能提供了新思路,通过引入负样本的知识,弥补了传统研究方法的不足,为推理任务的应用提供了更可靠和高效的解决方案。
淄博烧烤,带火五一“山东游”
“小饼烤炉加蘸料”的烧烤三件套,正在成为年轻人的新晋社交暗号。截至目前,抖音平台上“淄博烧烤”话题的视频总播放量超过62亿,两个月内18次霸榜微博热搜,小红书关于“淄博”的笔记达66万篇。而在这些社交平台上,随处可见周末去山东进行”特种兵式旅游”的大学生,以及求“五一组队”、求“烧烤搭子”的年轻人。站长网2023-04-20 18:16:550001登陆iOS后:安卓版ChatGPT即将上线
快科技5月23日消息,在上周,OpenAI带来了一个重磅消息,宣布ChatGPT正式登陆iOS平台,引起广泛关注。现在,OpenAI方面做出回应,承诺ChatGPT应用将很快登陆Android平台。不出意外,安卓版的ChatGPT将和iOS版本一致,基于Whisper开源模型,集成了语音转文本功能,方便用户通过语音快速跟ChatGPT进行对话交流。站长网2023-05-23 11:32:230000新品37期 | 滑动匹配、短视频回复、NPC交互,AI应用越走越宽
在上一期中,我们详细介绍了GhostAIWithFriends、Snack、Gemsouls和Iris等4款AI社交产品。这一期,我们将会介绍Hyper、Blush、Pheon、Replica等4款将AI在产品中实际落地的应用。Hyper:Avatar动捕声音=你的AI好友?站长网2023-08-15 09:22:580000小米相册AI编辑上线「智能扩图」、「魔法消除Pro」等功能
今日,小米官方宣布小米相册AI编辑「智能扩图」、「魔法消除Pro」正式上线,预计在本月内全面覆盖小米14、小米14Pro以及RedmiK70系列手机,为用户带来更为智能与便捷的相册编辑体验。智能扩图功能,旨在解决用户在拍摄过程中可能遇到的构图问题。用户只需在相册编辑界面选择裁切旋转功能,然后点击智能扩图,系统便能自动对图片进行扩展和重新构图,让照片更具艺术感。站长网2024-03-14 17:14:050000WPS月活设备达5.86亿!金山办公三季度报告:个人订阅营收增长25%
快科技10月25日消息,今天晚间,金山办公发布了2023年第三季度报告。根据报告显示,2023年前三季度金山办公共营收约32.7亿元,同比上涨16.99%,归属于母公司净利润约8.93亿元,同比上涨9.86%。第三季度实现营收约10.98亿元,同比上涨9.4%;归属于母公司净利润2.94亿元,同比上涨0.18%。站长网2023-10-25 20:25:480001