登陆注册

高性能

  • ​迷你AI模型TinyLlama发布:高性能、仅637MB

    划重点:-🚀经过期待已久,TinyLlama项目发布了一款占用仅637MB的高性能AI模型。-📲可在边缘设备上部署,也可用于辅助大型模型的推测解码。-🌐TinyLlama是Meta开源语言模型Llama2的紧凑版本,性能优越,适用于多领域的语言模型研究。
    站长网2024-01-06 11:15:50
    0002
  • 开源LLM部署框架FlexFlow:低延迟、高性能

    FlexFlow是一个分布式深度学习框架,提供低延迟、高性能的LLM(LargeLanguageModel)模型服务。它通过使用推测性推理和树状并行解码技术,显著提高了LLM模型的服务速度。项目地址:https://github.com/flexflow/FlexFlow
    站长网2023-08-23 16:26:52
    0001