登陆注册

算法非常强

  • OpenAI科学家盛赞中国大模型:算法非常强,算力用到极致!

    OpenAI创始团队成员、高级研究科学家AndrejKarpathy很罕见地,分享了一个来自中国的开源大模型——DeepSeek-v3。Karpathy表示,DeepSeek仅用了280万小时的GPU算力,就训练出了比Llama-3405B(使用3080万小时GPU)更强的前沿模型,整体成本节省了11倍左右,将算力发挥到了极致。
    站长网2024-12-30 09:18:31
    0002