登陆注册

为什么说DeepSeek是2025年的Kimi

  • 为什么说DeepSeek是2025年的Kimi

    DeepSeek是否能定义“低成本训练”概念?岁末年初,杭州的大模型创业公司“深度求索”DeepSeek不断放出大新闻。它所公布的一个开源模型DeepSeek-V3,在各种基准测试等方面,能够大致打平需要付钱的GPT-4o。而一个更重要的问题是,这是中国公司在受到制裁,算力有限,不能购买足够数量显卡的基础上,使用小数据集蒸馏等方法,而得到的一个更节省成本的模型。
    站长网站长资讯2025-01-02 11:23:51
    0000