登陆注册

英伟达nGPT重塑Transformer

  • 英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快

    【新智元导读】LLM训练速度还可以再飙升20倍!英伟达团队祭出全新架构归一化Transformer(nGPT),上下文越长,训练速度越快,还能维持原有精度。AI的未来,或许就此改写......最近,英伟达团队抛出的一枚重磅炸弹,提出了全新神经网络架构——归一化Transformer(nGPT),基于超球面(hypersphere)进行表示学习。
    站长网站长资讯2024-10-21 09:22:07
    0000