小红书提出创新框架:充分利用负样本提升大语言模型推理能力

站长网2024-01-24 16:59:130阅

要点:

小红书搜索算法团队在AAAI2024上提出了一种创新框架，利用负样本知识来提升大语言模型（LLMs）的推理能力。

他们设计了一个模型专业化框架，包括负向协助训练（NAT）、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤，全面利用负样本在知识蒸馏中的关键作用。

该框架通过在训练和推理过程中充分利用负样本，使得小模型能够更好地处理复杂的数学推理问题，避免大模型的黑盒属性和庞大参数量的限制。

在AAAI2024上，小红书搜索算法团队推出了一项创新框架，旨在解决大语言模型（LLMs）在推理任务中的黑盒属性和庞大参数量带来的问题。传统研究方法主要关注正样本，而这项工作强调了负样本在知识蒸馏中的价值。通过负向协助训练(NAT)、负向校准增强(NCE)和动态自洽性(ASC)等序列化步骤，他们构建了一个全方位利用负样本的模型专业化框架。

论文地址:https://arxiv.org/pdf/2312.12832.pdf

首先，他们提出了负向协助训练（NAT）方法，通过设计dual-LoRA结构，从正向和负向两方面获取知识。这一步骤在训练中动态地集成正、负LoRA模块的知识，以构建更全面的推理能力。其次，他们设计了负向校准增强(NCE)，利用负知识来帮助自我增强过程，通过KL散度来度量正、负推理链路之间的不一致性，以选择性地学习和增强嵌入的知识。

除了训练阶段，他们还在推理过程中利用负向信息，提出了动态自洽性（ASC）方法，通过排序模型在正、负样本上进行训练，为正确答案的推理链路分配更高的权重。整体来说，这一框架通过充分挖掘负样本的宝贵信息，使得小模型能够更有效地进行复杂的算术推理，从而在实际应用中更广泛地部署大语言模型的推理能力。

这一研究为提高大语言模型应用性能提供了新思路，通过引入负样本的知识，弥补了传统研究方法的不足，为推理任务的应用提供了更可靠和高效的解决方案。

小红书提出创新框架充分利用负样本提升大语言模型推理能力

0000

评论列表

共(0)条

相关推荐

站长资讯
eBay 推出 AI 辅助背景工具，增强产品图片
划重点:-eBay推出新的AI背景增强工具，允许卖家用AI生成的背景替换图片背景-该工具已在美国、英国和德国的iOS用户中推出，将逐渐在未来几个月内向Android用户推出-这一举措使得卖家无需专业设备或技能即可拍摄出专业外观的高质量照片
站长网2024-06-06 20:46:07
0000
OpenAI砸了谁的饭碗？
OpenAI越变越强，不仅抢走谷歌等科技巨头的生意，还在砸掉创业者的饭碗。首届开发者大会之后，很多开发者担忧，自己的项目是否会被替代。而在开会之前，已经有好几家AI公司启动裁员，其中不乏曾拿过巨额融资的明星项目。
站长网站长资讯2023-11-22 14:05:05
0001
站长资讯
AI在线字幕生成工具字幕酱可自动生成、翻译字幕
字幕酱是一个在线字幕生成工具，利用AI深度学习技术，提供自动字幕生成、字幕翻译、字幕格式转换等功能。基于AI人工智能，字幕酱可以在线自动生成、自动翻译、格式转换和制作双语字幕。支持多种语言，如中文、英文、粤语、日语、韩语、德语、法语、西班牙语等，并提供在线语音转字幕工具。体验地址:https://www.zimujiang.com/特色功能:60秒内短视频免费，性价比极高;
站长网2023-08-21 14:36:29
0002
泰国皇家集团索赔中国瑞幸100亿瑞幸:未接通知
据泰国媒体报道，泰国皇家50R集团向法院提交诉讼，要求中国瑞幸咖啡赔偿100亿泰铢经济损失。法院已立案受理。文件显示，50R集团2020年向泰国商务部注册瑞幸商标，获准使用经营咖啡店。但中国瑞幸向法院提起诉讼，指控其恶意注册。初审判决50R败诉。50R不服提出上诉，12月1日二审胜诉。对此，瑞幸咖啡未就此事置评。瑞幸客服表示，未收到通知。
站长网站长资讯2023-12-20 11:46:24
0000
站长资讯
李国庆称ChatGPT替代不了阅读后者可以安慰心灵
据《中国企业家》杂志消息，在4月23日的一次读书活动中，当当网创始人李国庆分享了他的观点。李国庆认为，ChatGPT无法取代阅读的作用。阅读不仅可以让人的内心得到平静，也是一种审美享受，这些都是ChatGPT所无法替代的。此外，在晚上睡不着的时候，阅读文学作品能够安慰心灵。而阅读的另一个重要作用则是帮助人们求道解惑。通过阅读，人们可以以较低的成本获得各种知识，这是最有价值的一种投资。
站长网2023-04-23 17:34:21
0000