登陆注册

微软LongRoPE方法让LLM上下文窗口突破

  • 微软LongRoPE方法让LLM上下文窗口突破 200 万 8倍扩展还保持性能

    划重点:⭐LongRoPE方法将LLM的上下文窗口扩展至2048k,无需架构变化复杂微调⭐通过高效搜索识别位置插值中的非均匀性,为微调提供更好初始化,展8倍而保持性能⭐实验结果表明LongRoPE成功将LLM上下文窗口扩展至2048k,并在较短长度内保持与基线相当或更好的困惑度
    站长网2024-04-29 17:14:56
    0000