华盛顿大学推高效大模型调优方法“代理调优”
站长网2024-01-24 09:26:500阅
要点:
1、代理调优方法无需接触模型的内部权重。
2、通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测。
3、代理调优方法能够在解码时更好地保留训练知识。
华盛顿大学推出更高效的大模型调优方法“代理调优”,该方法通过对比小型调整模型和未调整模型的预测结果来引导基础模型的预测,实现对模型的调优而无需接触模型的内部权重。
随着ChatGPT等生成式AI产品的发展,基础模型的参数不断增加,因此进行权重调优需要耗费大量时间和算力。为提升调优效率,该方法可以在解码时更好地保留训练知识,同时保留更大规模预训练的优势。研究人员对LlAMA-2的13B、70B原始模型进行了微调,结果显示代理调优的性能比直接调优的模型更高。
论文地址:https://arxiv.org/pdf/2401.08565.pdf
该方法需要准备一个小型的预训练语言模型M-,与基础模型M共享相同的词汇表,然后使用训练数据对M-进行调优得到调优模型M 。
在解码时,通过对比基础模型M的输出预测分布和调优模型M 的输出预测分布之间的差异,来引导基础模型的预测,最后将预测差异应用于基础模型的预测结果,以引导基础模型的预测朝向调优模型的预测方向移动。这一方法与大模型中的“蒸馏”技术恰恰相反,是一种创新性的调优方法。
代理调优方法的推出,为大模型的调优提供了更高效的解决方案,同时也可以在解码时更好地保留训练知识,使得模型的性能更高。这一方法的推出将为AI领域的发展带来新的启示,值得进一步深入研究和应用。
0000
评论列表
共(0)条相关推荐
Hugging Face研究人员推语音识别模型Distil-Whisper 速度提高、参数减少
划重点:⦁HuggingFace研究人员利用伪标记创建了一个庞大的开源数据集,用于提炼Whisper模型的较小版本,称为Distil-Whisper。⦁Distil-Whisper在挑战性的声学条件下保持了Whisper模型的韧性,同时减轻了长篇音频中的错觉错误。⦁自动语音识别(ASR)系统已达到人类水平的准确度,但由于预训练模型的不断增大,在资源受限的环境中面临挑战。站长网2023-11-09 14:53:080000快手短剧日均DAU达2.7亿 创作者数量突破10万
在最新的快手短剧生态大会上,快手副总裁兼快手文娱业务负责人陈弋弋透露快手星芒短剧在2023年的惊人成绩。这次的盛会将目光聚焦在短剧创作和观众规模的增长,以及快手短剧在娱乐市场的卓越表现。0000今年目标超10万根!华为:2万根超快充充电桩投入运营
快科技3月17日消息,中国电动汽车百人会论坛(2024)日前在北京召开,华为董事、华为数字能源总裁侯金龙在论坛上发表主题演讲。侯金龙表示,2024年,华为数字能源将计划携手伙伴共同部署超过10万根超快充充电桩,目前已有2万根超快充充电桩投入运营。为实现加速建设以超快充为主的充电基础设施,促进电动汽车普及的目标,侯金龙还向业界提出四大呼吁:0001AI爆款设备Rabbit R1将接收Perplexity AI的实时信息
划重点:-🐰Rabbit与Perplexity达成合作伙伴关系,将把“对话式AI动力回答引擎”与R1连接起来。-📱R1已经售出超过5万份预订。-💡Perplexity的AI引擎将提供“实时更新答案”的功能,与过去某个时间点的数据相比,不会有任何知识限制。站长网2024-01-19 14:20:040000