登陆注册

DeepSeek绕开CUDA垄断

  • DeepSeek绕开CUDA垄断,V3论文细节再挖出!英伟达护城河不存在了?

    原本DeepSeek低成本训出的R1,就已经让整个硅谷和华尔街为之虎躯一震。而现在又曝出,打造这款超级AI,竟连CUDA也不需要了?根据外媒的报道,他们在短短两个月时间,在2,048个H800GPU集群上,训出6710亿参数的MoE语言模型,比顶尖AI效率高出10倍。这项突破不是用CUDA实现的,而是通过大量细粒度优化以及使用英伟达的类汇编级别的PTX(并行线程执行)编程。
    站长网站长资讯2025-02-02 16:30:39
    0000