登陆注册

LM

  • vivo大模型云端方案vivo_Agent_LM_7B亮相

    近日,vivo的大模型云端方案也已经出现在C-Eval排行榜上。该排行榜是一个全面的中文基础模型评估套件,包含13948个多项选择题,涵盖人文、社科、理工等多个学科和不同难度级别。从C-Eval给出的信息来看,vivo_Agent_LM_7B是由vivoAI全球研究院自主研发的大规模预训练语言模型,拥有70亿参数。
    站长网2023-08-16 09:05:13
    0006
  • 字节万卡集群技术细节公开:2天搞定GPT-3训练,算力利用率超英伟达Megatron-LM

    随着对Sora技术分析的展开,AI基础设施的重要性愈发凸显。来自字节和北大的一篇新论文在此时吸引关注:文章披露,字节搭建起的万卡集群,能在1.75天内完成GPT-3规模模型(175B)的训练。具体来说,字节提出了一个名为MegaScale的生产系统,旨在解决在万卡集群上训练大模型时面临的效率和稳定性挑战。
    站长网2024-03-01 15:02:35
    0004
  • Stability AI发布移动端语言模型Stable LM 3B

    StabilityAI发布了最新的语言模型StableLM3B,该模型是为便携式数字设备设计的,参数规模为30亿,比行业通常使用的70亿参数模型要小,具有更高的性能和可移植性。StableLM3B具有较小的体积和高效性的优势,需要更少的资源和较低的运行成本,使其对大多数用户来说更加可承受。与此同时,它的能效更高,减少了能源消耗,具有环保特性。
    站长网2023-10-09 09:25:24
    0001