登陆注册

低延迟

  • 开源LLM部署框架FlexFlow:低延迟、高性能

    FlexFlow是一个分布式深度学习框架,提供低延迟、高性能的LLM(LargeLanguageModel)模型服务。它通过使用推测性推理和树状并行解码技术,显著提高了LLM模型的服务速度。项目地址:https://github.com/flexflow/FlexFlow
    站长网2023-08-23 16:26:52
    0001