DeepSeek发布V2模型 GPT-4的性能白菜的价格
DeepSeek在开源MoE(Mixture of Experts)模型领域取得了重要进展,继今年1月份开源国内首个MoE模型后,现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现,与GPT-4等闭源模型竞争,同时在成本效益上具有显著优势。

模型权重下载:https://top.aibase.com/tool/deepseek-v2-chat
体验地址:https://chat.deepseek.com/sign_in
DeepSeek-V2在主流模型评测榜单中表现卓越,尤其在中文综合能力(AlignBench)和英文综合能力(MT-Bench)上,与顶尖闭源模型并驾齐驱。此外,在知识、数学、推理、编程等专业榜单上,DeepSeek-V2也取得了领先位置。
DeepSeek-V2采用了创新的模型结构,提出了MLA(Multi-head Latent Attention)架构,该架构在减少计算量和推理显存方面有显著优势。结合自研的Sparse结构DeepSeekMoE,模型在保持性能的同时,将计算量降至最低。
DeepSeek-V2以较低的显存消耗实现了高性能,其每token成本大幅降低,使得实际部署在8卡H800机器上的输入吞吐量超过每秒10万tokens,输出超过每秒5万tokens。API定价为每百万tokens输入1元、输出2元,价格极具竞争力。
DeepSeek秉持开源精神,将DeepSeek-V2模型和相关论文完全开源,免费商用,无需申请。模型权重可在Hugging Face平台获取,技术报告则发布在GitHub上。
DeepSeek提供了对话官网和开放平台,用户可以在chat.deepseek.com免费开启对话,而DeepSeek API开放平台则提供注册即赠送大量tokens的优惠,以支持优质项目的发展。
我,用AI帮1000名准妈妈预测婴儿长相,每单卖9.9元
ChatGPT(生成式对话机器人)公测已有8个月,数的上号的国内外科技公司无一例外地在这期间推出了自己的AI大模型。但热闹的另一面,是这些AI大模型的商业化,至今仍处在探索阶段。相较于大公司探索大业务,中国小商家总是能机敏地在技术迭代的过程中,找到做小生意的空间。比如我们曾经观察过的,那些“注册200个账号,卖5万一套的系统,靠ChatGPT赚钱的人”。站长网2023-07-21 16:46:460000抖音火花bug上热搜 客服回应:会有专人核实
站长之家(ChinaZ.com)2月29日消息:近日,有网友在社交媒体上反映称,抖音平台的“火花”功能似乎出现了问题。即便与好友互相发送消息,火花标识却始终无法点亮。这一问题迅速引发了广泛关注,相关话题“#抖音火花bug#”迅速登上热搜榜。站长网2024-02-29 10:19:530000百度和小红书夺走的,淘宝想用AI夺回来
淘宝问问可能替代淘宝搜索淘宝在搜索框里加上了AI应用——淘宝问问,它的核心目标是成为下一代的电商智能导购。相比于商业化,淘宝问问更在意如何留住更多新用户。淘宝问问的野心不止于电商,它还会在生活、消费甚至娱乐方面探索边界。如何在近9亿用户的基础上再去寻找新的增量?这是淘天CEO戴珊不得不面对的新挑战。0000抖音电商推出商家扶持计划:加大算法研发投入 升级流量机制
抖音电商今日宣布推出其历史上规模最大的商家扶持计划,详细公布了九大扶持举措。这些措施旨在帮助商家降低成本、提升经营体验,并解决退货、价格战、广告投放等问题。具体措施包括免除佣金、退单推广费返还、降低运费险和保证金等成本控制措施。0000