登陆注册

显著减少LLaMA微调的显存需求

  • 清华提出4比特优化器 显著减少LLaMA微调的显存需求

    要点:1、针对优化器状态的量化方法,将优化器状态的数值精度降低至4比特2、提出了针对一阶矩和二阶矩的量化策略,处理了零点问题等难点3、在多个微调任务中达到全精度优化器的性能,同时可将LLaMA微调的显存需求减少超过50%
    站长网2023-09-08 14:05:23
    0000