DeepSeek发布V2模型 GPT-4的性能白菜的价格
DeepSeek在开源MoE(Mixture of Experts)模型领域取得了重要进展,继今年1月份开源国内首个MoE模型后,现在发布了第二代MoE模型:DeepSeek-V2。这一新模型在多项性能评测中均展现出色的表现,与GPT-4等闭源模型竞争,同时在成本效益上具有显著优势。
模型权重下载:https://top.aibase.com/tool/deepseek-v2-chat
体验地址:https://chat.deepseek.com/sign_in
DeepSeek-V2在主流模型评测榜单中表现卓越,尤其在中文综合能力(AlignBench)和英文综合能力(MT-Bench)上,与顶尖闭源模型并驾齐驱。此外,在知识、数学、推理、编程等专业榜单上,DeepSeek-V2也取得了领先位置。
DeepSeek-V2采用了创新的模型结构,提出了MLA(Multi-head Latent Attention)架构,该架构在减少计算量和推理显存方面有显著优势。结合自研的Sparse结构DeepSeekMoE,模型在保持性能的同时,将计算量降至最低。
DeepSeek-V2以较低的显存消耗实现了高性能,其每token成本大幅降低,使得实际部署在8卡H800机器上的输入吞吐量超过每秒10万tokens,输出超过每秒5万tokens。API定价为每百万tokens输入1元、输出2元,价格极具竞争力。
DeepSeek秉持开源精神,将DeepSeek-V2模型和相关论文完全开源,免费商用,无需申请。模型权重可在Hugging Face平台获取,技术报告则发布在GitHub上。
DeepSeek提供了对话官网和开放平台,用户可以在chat.deepseek.com免费开启对话,而DeepSeek API开放平台则提供注册即赠送大量tokens的优惠,以支持优质项目的发展。
华为宣布将发布5G-A全系列产品与通信大模型
随着2024世界移动通信大会(MWC2024)的临近,华为等多家中国企业已确认参展。此次大会将于2月26日至29日在巴塞罗那盛大举行。华为官方今日宣布,在大会期间,华为将举办2024产品与解决方案发布会,全球首发其通信大模型,并推出一系列5G-A(即5.5G)产品与解决方案。站长网2024-02-22 08:31:590000GitHub一项调查显示:92%的程序员正在使用人工智能
GitHub进行了一项调查,旨在了解有多少程序员正在使用AI工具。结果显示,500名接受调查在美国工作的开发人员中有92%的人表示已经将AI工具整合到了工作中,而70%的人表示这些工具为他们的工作带来了“优势”。站长网2023-06-20 17:10:320001TikTok 可能在下个月推出在线商店
站长之家(ChinaZ.com)6月29日消息:据Semafor报道,TikTok正在为美国客户准备一家网上商店。该店面将位于TikTok应用程序的电子商务选项卡下。一系列精选商品以及通过TikTokShop(其现有的应用内购物功能)列出的待售产品都将出售。该功能最早可能在下个月推出。站长网2023-06-29 19:26:340000辟谣:蝙蝠携带病毒却不生病,仅仅是体温高那么简单?
蝙蝠体内携带有众多对人类非常危险的病毒,包括埃德拉病毒、马尔堡病毒、亨德拉病毒、尼帕病毒和中东呼吸综合征冠状病毒等,这些病毒的流行曾导致大量人死亡,然而蝙蝠自己却从不因此生病,这是为什么呢?站长网2023-05-23 15:35:120000群聊冷场怎么破?茴香豆用AI帮你解决问题
要点:1.茴香豆(HuixiangDou)是基于大语言模型的群聊知识助手,专注于解决群聊中的技术问题,可以集成到即时通讯工具中,如微信和飞书。2.主要功能包括技术问题解答、适应群聊环境、避免信息泛滥、领域特定知识理解、高度定制化回应、长上下文处理能力等,支持远程和本地LLM服务,以及搜索增强和调参优化。站长网2024-01-25 11:34:550000