幻方DeepSeek-V2系列模型已在魔搭社区开源
站长网2024-05-08 19:52:530阅
魔搭ModelScope社区宣布,DeepSeek-V2系列模型现已在魔搭ModelScope社区开源。
据悉,幻方公司在5月6日推出了第二代 MoE 模型 DeepSeek-V2,并开源了技术报告和模型权重,该模型引入了 MLA 架构和自研 Sparse 结构 DeepSeekMoE,以236B 总参数、21B 激活,实际部署在8卡 H800机器上,输入吞吐量超过每秒10万 tokens 输出超过每秒5万 tokens。
性能方面,在目前大模型主流榜单中,DeepSeek-V2均表现出色:
中文综合能力(AlignBench)开源模型中最强,与GPT-4-Turbo,文心4.0等闭源模型在评测中处于同一梯队
英文综合能力(MT-Bench)与最强的开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral8x22B
知识、数学、推理、编程等榜单结果也位居前列
支持128K上下文窗口
和DeepSeek67B相比,DeepSeek-V2节约了42.5%训练成本,推理的KV Cache节约了93.3%,最大吞吐是之前的576%。
DeepSeek-V2的推理代码和模型下载链接已经在魔搭 ModelScope 社区开源,用户可以通过该平台直接下载模型。
项目地址:
DeepSeek-V2-Chat:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V2-Chat
DeepSeek-V2:
https://modelscope.cn/models/deepseek-ai/DeepSeek-V2
0000
评论列表
共(0)条相关推荐
索尼PS5轻薄版国行版12月1日开售 售价2999元起
索尼正式公布了PS5轻薄版国行的上市时间和售价。这款新型游戏机将于12月1日在中国大陆市场推出,数字版售价为2999元,而配备超高清蓝光光驱的光驱版售价为3599元。PS5轻薄版的设计使得超高清蓝光光驱和直立支架在同一天推出,它们的售价分别为759元和229元。这款新型游戏机的体积比原型号减少了30%以上,重量也相应减轻了18%和24%。站长网2023-10-24 23:16:090001特斯拉新款Roadster跑车年底亮相 马斯克:加速时间不到1秒
特斯拉创始人埃隆·马斯克今日在X平台上发布了一系列关于特斯拉第二代Roadster跑车的帖子,引发广泛关注。他自豪地宣布,新款Roadster跑车的设计目标已大幅提升,有望成为有史以来最令人兴奋的产品。马斯克在帖子中透露,特斯拉Roadster的生产计划已经完成,预计将在年底正式推出,并计划明年开始发货。他强调,这款跑车不仅在设计上有所突破,更在性能上达到了前所未有的高度。站长网2024-02-28 16:10:300000ChatTTS:一个专为对话场景设计的语音生成模型
ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和视频介绍等应用。这个模型支持中文和英文,并且在视频中展示的是中等参数的版本,使用了约10万小时的中英文数据进行训练。项目团队在视频中明确表示,虽然他们感谢关注,但可能不会开源视频中展示的版本,因为该版本使用了大量互联网数据,并进行了特定的训练方式,可能涉及法律风险。站长网2024-05-28 19:35:4400080马斯克:企业需要花费数十亿美元在人工智能硬件上 才能保持竞争力
埃隆·马斯克将人工智能竞赛比作一场高风险的扑克游戏,企业需要花费数十亿美元在人工智能硬件上,才能保持竞争力。图源备注:图片由AI生成,图片授权服务商Midjourney这位亿万富翁说,特斯拉仅在2024年就会花费超过5亿美元购买英伟达的人工智能芯片——但他警告说,它需要“数百亿美元”价值的硬件,才能跟上它最大的竞争对手。站长网2024-01-30 12:02:390000英特尔推出企业级通用人工智能软件公司Articul8
**划重点:**1.🧠英特尔与DigitalBridge合作推出新的企业级通用人工智能软件公司Articul8。2.💼Articul8源于英特尔与波士顿咨询集团(BSG)的合作,构建了一款可读取文本和图像的通用人工智能系统。3.🌐Articul8定位于金融服务、航空航天、半导体、电信等领域,强调高级别安全性和专业领域知识。0000