华盛顿大学推高效大模型调优方法“代理调优”

站长网2024-01-24 09:26:500阅

要点:

1、代理调优方法无需接触模型的内部权重。

2、通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测。

3、代理调优方法能够在解码时更好地保留训练知识。

华盛顿大学推出更高效的大模型调优方法“代理调优”，该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测，实现对模型的调优而无需接触模型的内部权重。

随着ChatGPT等生成式AI产品的发展，基础模型的参数不断增加，因此进行权重调优需要耗费大量时间和算力。为提升调优效率，该方法可以在解码时更好地保留训练知识，同时保留更大规模预训练的优势。研究人员对LlAMA-2的13B、70B原始模型进行了微调，结果显示代理调优的性能比直接调优的模型更高。

论文地址:https://arxiv.org/pdf/2401.08565.pdf

该方法需要准备一个小型的预训练语言模型M-，与基础模型M共享相同的词汇表，然后使用训练数据对M-进行调优得到调优模型M 。

在解码时，通过对比基础模型M的输出预测分布和调优模型M 的输出预测分布之间的差异，来引导基础模型的预测，最后将预测差异应用于基础模型的预测结果，以引导基础模型的预测朝向调优模型的预测方向移动。这一方法与大模型中的“蒸馏”技术恰恰相反，是一种创新性的调优方法。

代理调优方法的推出，为大模型的调优提供了更高效的解决方案，同时也可以在解码时更好地保留训练知识，使得模型的性能更高。这一方法的推出将为AI领域的发展带来新的启示，值得进一步深入研究和应用。

华盛顿大学推高效大模型调优方法代理调优

0000

评论列表

共(0)条

相关推荐

站长资讯
欧盟希望最早今年为生成式 AI 制定新规则：拟设立「AI 制作」标签
欧盟委员会执行副主席玛MargretheVestager周一对NikkeiAsia表示，欧盟希望最早在今年就ChatGPT等生成式人工智能的全球规则达成一致。
站长网2023-04-25 14:19:00
0001
站长资讯
小心啊，618前封号和卖货一起在发力
很多品牌此刻开始了自己的618电商营销，但，第一天就遭遇滑铁卢:企微账号又被封了!!有品牌直呼，封号潮还没过去啊，太吓人了。是的，封号潮还没过去!4月份的封号中，见实就曾做出提醒，618之前还会继续有一波封号（点此查看:小心，又一波封号潮正在进行）。随着企微对账号运营合规性监管的日趋严格，节假日前的封号似乎正在成为一种常态，而此刻正是618前的正常封号潮。
站长网2024-05-16 09:01:03
0000
站长资讯
手握10万主播达人，无忧传媒攻不下电商
无忧传媒持续加码电商直播业务，与互联网监管日趋严格，秀场直播行业有关。虽然目前无忧传媒已经在电商直播赛道展露头角，但值得注意的是，目前其仅有几个知名的电商主播，与超十万的主播达人大盘相比，显得微不足道。为了扩大电商业务的影响力，无忧传媒已不满足于抖音内部的流量。
站长网2023-07-04 16:18:10
0001
站长资讯
小米回应无法退定金问题：消费者主动锁单就不再退还
昨晚，备受瞩目的小米SU7正式上市开售，三个版本的新车售价区间定为21.59万元至29.99万元。据官方数据显示，新车销售势头强劲，上市仅4分钟便有大定订单突破万辆，7分钟后更是达到2万辆，而在短短的27分钟内，大定订单数量已突破惊人的5万辆。特别值得一提的是，限量发售的5000台创始版本车型，在预订开启的短短百秒内即被抢购一空，可见其受欢迎程度。
站长网2024-04-06 14:20:40
0000
站长资讯
贾扬清周末项目Lepton Search登顶GitHub热榜 500行代码打造
要点:1、LeptonSearch是一款使用500行代码打造的AI搜索引擎，旨在向开发者展示简洁高效的实现方式。2、AI搜索引擎的复杂性仍然存在，LeptonSearch之所以能实现500行代码就完成一个产品的雏形，是因为调用了自家云上部署的开源模型和数据存储。3、AI搜索引擎在当前行业中具有重要地位，一些大公司和创业项目都在不同程度上探索和应用AI搜索技术。
站长网2024-01-29 15:11:24
0001