DeepSeek发布V2模型 GPT-4的性能白菜的价格
DeepSeek在开源MoE(Mixture of Experts)模型领域取得了重要进展,继今年1月份开源国内首个MoE模型后,现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现,与GPT-4等闭源模型竞争,同时在成本效益上具有显著优势。
模型权重下载:https://top.aibase.com/tool/deepseek-v2-chat
体验地址:https://chat.deepseek.com/sign_in
DeepSeek-V2在主流模型评测榜单中表现卓越,尤其在中文综合能力(AlignBench)和英文综合能力(MT-Bench)上,与顶尖闭源模型并驾齐驱。此外,在知识、数学、推理、编程等专业榜单上,DeepSeek-V2也取得了领先位置。
DeepSeek-V2采用了创新的模型结构,提出了MLA(Multi-head Latent Attention)架构,该架构在减少计算量和推理显存方面有显著优势。结合自研的Sparse结构DeepSeekMoE,模型在保持性能的同时,将计算量降至最低。
DeepSeek-V2以较低的显存消耗实现了高性能,其每token成本大幅降低,使得实际部署在8卡H800机器上的输入吞吐量超过每秒10万tokens,输出超过每秒5万tokens。API定价为每百万tokens输入1元、输出2元,价格极具竞争力。
DeepSeek秉持开源精神,将DeepSeek-V2模型和相关论文完全开源,免费商用,无需申请。模型权重可在Hugging Face平台获取,技术报告则发布在GitHub上。
DeepSeek提供了对话官网和开放平台,用户可以在chat.deepseek.com免费开启对话,而DeepSeek API开放平台则提供注册即赠送大量tokens的优惠,以支持优质项目的发展。
马斯克的脑机接口公司今年有望完成10例手术
埃隆·马斯克的脑机接口公司Neuralink在一项新的进展中,已经为第二名患者成功植入了其创新的脑机接口设备。马斯克在一次节目中宣布了这一消息,并表示公司计划在今年内为另外8名患者进行植入手术,作为公司临床试验的一部分。这将标志着Neuralink在脑机接口领域的进一步发展,届时将完成总共10例植入手术。站长网2024-08-05 16:40:500000被AI改变的00后娱乐习惯
初见文生图、文生视频的震撼还清晰如同昨日,硬糖君的记忆更停留在AI绘画导致LOFTER用户销号事件——可能是这个冷门社区近年来站得最高的一次。但不到两年时间,AIGC已经随风潜入夜。如果说AI翻唱、AI换脸、AI绘画还是在借助新工具进行自我表达,那么在互动同人文、AI智能体的方兴未艾中,最年轻的那波年轻人,已经毫无障碍地将表达本身也交给了AI。站长网2024-04-23 17:21:030000老黄H100再破纪录,4分钟训完GPT-3!全新「特供版」H20、L20和L2曝光,性能史诗级缩水
H100再次在MLPerf中刷新了记录!英伟达超算NVIDIAEos在GPT-3模型的基准测试中,只用了3.9分钟就完成了训练。这比6月份的刷新记录的成绩——10.9分钟,提升了近3倍。Eos使用了多达10,752个H100和NVIDIAQuantum-2InfiniBand网络互连。通过推算,Eos现在可以在短短8天内进行训练,比之前使用512个A100GPU的先进系统快73倍。站长网2023-11-10 16:10:320000李想谈苹果取消造车 称苹果放弃造车是正确选择
今日早间,一则重磅消息震惊了科技界和汽车圈:经过长达十年的探索,苹果决定放弃造车计划。这一决定立即引发了行业内外的广泛关注和热议。据知情人士透露,苹果已经取消了电动汽车项目,并将相关团队转向生成式人工智能。这意味着,苹果正逐步结束其十年之久的电动汽车探索计划。站长网2024-02-28 11:34:160000抖音医疗新规11月1日生效:严打借同质化等虚假内容导流获利
抖音集团近日发布了针对医疗内容的新规,旨在严厉打击平台上的虚假医疗信息和违规导流获利行为。新规定明确禁止创作者发布虚假医疗信息,夸大或虚构医疗水平,以及通过打造“神医”“名医”等虚假人设诱导欺骗用户。此外,新规还禁止利用热点医疗事件进行不当营销,要求创作者在引用热点事件或案例时必须明确标注信息来源,避免误导。站长网2024-09-12 03:53:020000