DeepSeek发布V2模型 GPT-4的性能白菜的价格
DeepSeek在开源MoE(Mixture of Experts)模型领域取得了重要进展,继今年1月份开源国内首个MoE模型后,现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现,与GPT-4等闭源模型竞争,同时在成本效益上具有显著优势。

模型权重下载:https://top.aibase.com/tool/deepseek-v2-chat
体验地址:https://chat.deepseek.com/sign_in
DeepSeek-V2在主流模型评测榜单中表现卓越,尤其在中文综合能力(AlignBench)和英文综合能力(MT-Bench)上,与顶尖闭源模型并驾齐驱。此外,在知识、数学、推理、编程等专业榜单上,DeepSeek-V2也取得了领先位置。
DeepSeek-V2采用了创新的模型结构,提出了MLA(Multi-head Latent Attention)架构,该架构在减少计算量和推理显存方面有显著优势。结合自研的Sparse结构DeepSeekMoE,模型在保持性能的同时,将计算量降至最低。
DeepSeek-V2以较低的显存消耗实现了高性能,其每token成本大幅降低,使得实际部署在8卡H800机器上的输入吞吐量超过每秒10万tokens,输出超过每秒5万tokens。API定价为每百万tokens输入1元、输出2元,价格极具竞争力。
DeepSeek秉持开源精神,将DeepSeek-V2模型和相关论文完全开源,免费商用,无需申请。模型权重可在Hugging Face平台获取,技术报告则发布在GitHub上。
DeepSeek提供了对话官网和开放平台,用户可以在chat.deepseek.com免费开启对话,而DeepSeek API开放平台则提供注册即赠送大量tokens的优惠,以支持优质项目的发展。
去哪儿:飞机燃油附加费1 月 5 日起将回落至 40/70 元
站长之家(ChinaZ.com)12月31日消息:去哪儿获悉,从2024年1月5日开始,各航空公司调整机票燃油附加费标准,800公里(含)以下航线和800公里以上航线分别下调10元和20元,较2023年有所降低。图源备注:图片由AI生成,图片授权服务商Midjourney0001麻省理工学院研究:辩论让AI机器人更加聪明
文章概要:1.MIT研究发现,多智能体辩论可以提高AI模型的准确性和推理能力。2.辩论方法减少了幻觉,帮助模型增强响应能力。3.研究团队发现,让多个AI系统辩论问题的答案比仅使用单个AI系统可以提高响应的准确性。站长网2023-09-21 11:01:2800002024,短剧能否带来品牌营销新增量?
在刚刚过去的2023年,抖音、快手、百度等多个平台持续布局短剧。一方面,头部影视公司、MCN机构下场,题材类型不断丰富走向多元。另一方面,用户付费、品牌植入等多商业模式被打开,短剧行业高速发展。2024年,短剧的热度依旧在持续,过年期间各个平台推出短剧春节档,以契合节日氛围的内容不断吸引用户的关注,多个品牌投入到短剧营销。当下,品牌短剧营销呈现什么特点?短剧营销比较适合哪些品牌?站长网2024-02-19 12:04:360001欧盟希望最早今年为生成式 AI 制定新规则:拟设立「AI 制作」标签
欧盟委员会执行副主席玛MargretheVestager周一对NikkeiAsia表示,欧盟希望最早在今年就ChatGPT等生成式人工智能的全球规则达成一致。站长网2023-04-25 14:19:000001微软与区块链公司Aptos合作,将人工智能与 web3 技术结合起来
本文概要:-微软与区块链公司Aptos合作,将人工智能和Web3技术结合起来。-合作使微软的人工智能模型可以使用Aptos的可验证区块链信息进行训练。-微软认为人工智能将在未来几个月和几年内在Web3解决方案中得到更大规模的应用。微软宣布与区块链公司AptosLabs合作开发人工智能和Web3技术。站长网2023-08-10 14:40:260000