登陆注册

H100可跑

  • 英伟达最强通用大模型Nemotron-4登场!15B击败62B,目标单张A100/H100可跑

    最近,英伟达团队推出了全新的模型Nemotron-4,150亿参数,在8Ttoken上完成了训练。值得一提的是,Nemotron-4在英语、多语言和编码任务方面令人印象深刻。论文地址:https://arxiv.org/abs/2402.16819在7个评估基准上,与同等参数规模的模型相比,Nemotron-415B表现出色。甚至,其性能超过了4倍大的模型,以及专用于多语言任务的模型。
    站长网2024-03-01 09:37:30
    0000
  • 英伟达发布Nemotron-4:150亿参数通用大模型,目标单张A100/H100可跑

    **划重点:**1.🌐Nemotron-4是英伟达最新的通用大模型,拥有150亿参数,在各语言和编码任务中表现出色。2.💡该模型采用Chinchilla模型的「缩放定律」,通过优化计算预算、数据和模型大小实现性能提升。3.🔥在多领域下游评估中,Nemotron-415B超越同等参数规模的模型,甚至击败4倍大的模型,成为最强通用语言模型。
    站长网2024-02-29 15:00:52
    0000