南加州大学提出通道式轻量级重编码CLR 解决大语言模型灾难性遗忘问题
要点:
1. 南加州大学和Google Research提出了通道式轻量级重编码(Channel-wise Lightweight Reprogramming)方法,用于解决持续学习问题,通过在固定任务不变的模型背骨干中添加轻量级可训练模块,对每层通道的特征图进行重编程,以适应新任务,仅占0.6%的额外参数。
2. 通道式轻量级重编码方法采用动态网络方式,可以持续学习多个新任务而不会出现灾难性遗忘,使模型在不同任务之间灵活转换。
3. 这项研究的动机是持续学习中的遗忘问题,提出了一种更轻量级但更强大的重编程方法,通过通道线性映射和卷积核的重编码,使模型能够适应多个新任务,实现更好的性能。
在持续学习领域,南加州大学和Google Research提出了一项创新的方法,通道式轻量级重编码(Channel-wise Lightweight Reprogramming,CLR),旨在解决模型在持续学习新任务时出现的灾难性遗忘问题。持续学习的关键挑战是如何在学习新任务后仍然保持对旧任务的性能,而CLR方法提供了一种有前景的解决方案。
与传统的多任务学习不同,持续学习是在一个接一个的任务中进行学习,模型需要逐个适应新的任务,同时尽量避免遗忘之前学到的知识。

论文地址: https://arxiv.org/pdf/2307.11386.pdf
项目地址: https://github.com/gyhandy/Channel-wise-Lightweight-Reprogramming
数据集地址: https://ilab.usc.edu/andy/skill102
CLR的创新之处在于它通过在模型的固定骨干(backbone)中引入可训练的轻量级模块,对每一层的通道特征图进行重编程,使其适用于新任务。这些轻量级模块仅占整个模型的0.6%额外参数,但为每个新任务提供了定制的特征。这意味着模型可以连续学习无数个新任务,而不会受到灾难性遗忘的困扰。

CLR方法采用了动态网络的方式,通过通道线性映射对卷积核产生的特征图进行重编程,实现了多个新任务之间的平滑切换。该方法的灵活性使其在持续学习中表现出色,即使面对众多新任务,每个轻量级模块所需的训练参数仍然非常有限,这使得模型的规模保持相对较小。
CLR方法通过引入轻量级重编程参数,使模型能够以更轻量级但更强大的方式适应不同的新任务。它解决了持续学习中的遗忘问题,为模型提供了更好的性能和灵活性。
通道式轻量级重编码(CLR)方法为持续学习领域带来了新的机会,使模型能够在不断学习新任务的同时,有效地保持对旧任务的性能,为多任务学习领域带来了新的突破。这一创新方法有望为未来的持续学习研究和应用提供更多的可能性。
推特大楼X新标志遭拆除 被邻居投诉亮度太大
周末,埃隆·马斯克在旧金山为X公司(XCorp.)选定了位置,在推特公司总部的顶部竖起了一个巨大的发光X标志。周一,有工人正在拆除了发光的X标志,移走了它的灯光和字母的一条臂,这座建筑在邻居和市政官员中引起了批评。到下午1点,标志已经从屋顶上移走了。站长网2023-08-01 08:56:180000沾AI价格暴涨十倍,玩具圈想再造一个泡泡玛特
在社交平台分享“显眼包”的帖子中,频繁出现“出吗”、“高价收”类似的评论。“显眼包”是字节此前给客户送出去的玩具,区别传统玩具,这是一款内嵌了豆包大模型、扣子专业版、语音识别、语音合成等技术的AI玩具。这款非卖品已经在二手平台被炒到300元左右的价格。“显眼包”的出圈印证了一个事实:这股硬件AI化的风已经吹到了玩具市场。0000马斯克称特斯拉公司视频生成技术超越OpenAI Sora
在周日晚间,特斯拉(Tesla)的创始人兼CEO埃隆·马斯克(ElonMusk)在社交媒体平台上发表帖子,声称特斯拉的视频生成技术在全球范围内处于领先地位,甚至超过了人工智能公司OpenAI的Sora。这一言论引起了广泛关注,特别是在自动驾驶技术领域。站长网2024-02-19 11:21:470001英国加大科技投资,人工智能与量子研究成重点
**划重点:**1.🤖英国政府将增加对人工智能(AI)的计算能力投资,额外拨款5亿英镑,总计超过15亿英镑。2.⚛️除了AI,政府还宣布了25亿英镑的国家量子战略,包括发展英国本土的量子计算机和推动未来的量子互联网。3.🚀在秋季声明中,英国还向太空领域注资1.21亿英镑,同时投资5.2亿英镑于生命科学制造,以及调整研发税收政策。站长网2023-11-23 14:48:540000TikTok电商大盘三位数增长,为什么赚钱的不是我?
站长网2024-02-07 16:03:410002