登陆注册

比从头开始预训练更划算

  • LLM-Shearing大模型剪枝法:用5%的成本拿下SOTA,比从头开始预训练更划算

    要点:1.陈丹琦团队开发了LLM-Shearing大模型剪枝法,可以将大型预训练模型剪枝至低成本,但高性能水平。2.剪枝方法将模型剪枝看作一种约束优化问题,同时学习剪枝掩码矩阵以最大化性能为目标。3.这种方法提供了一种有效的方式,可用于将剪枝后的模型继续预训练,最终超越从头开始预训练的模型。
    站长网2023-10-12 14:48:43
    0000