DeepSeek上线国家超算平台!671B满血版,三大运营商接入,平头哥芯片适配
DeepSeek的含金量还在上升,一个半个周末过去发生这些大事:
国家超算互联网平台上线DeepSeek-R1,最高支持671B的满血版。
平头哥玄铁芯片成功适配DeepSeek-R1系列蒸馏模型,在RISC-V架构CPU和端侧平台打开新的应用空间。
再加上春节期间的三大运营商全面接入DeepSeek等消息,它的影响力已不仅限于AI和互联网,正在往产业更深层进发。
总之,对于用户和开发者来说不用再看“服务器繁忙”的脸色,可以多换几个地方再试了。
随着官方服务器不堪重负,以及DeepSeek-V3API优惠结束恢复原价,各大云服务商也抓住机会卷了起来。
云服务卷价格,新式芯片卷速度
腾讯云率先上线支持联网搜索的DeepSeek,结合自家旗下搜狗搜索提供搜索增强API。
同时支持集成私域知识库,一键整合RAG。
商汤和阿里直接卷起了价格。
商汤大装置平台上3个月内可限时免费使用1000万tokens,同时支持128K最大上下文长度限制。
阿里云为新用户提供100万免费tokens,同时蒸馏版模型价格也比较低。
与此同时,各类芯片正在输出速度上展开激烈竞争。
通用GPU方面,AMD员工透露MI300X上的DeepSeek-R1满血版速度比刚发布时已经快了3倍,并发布官方Docker Image镜像。
在英伟达与CUDA生态之外,提供AMD与ROCm的另一种选择。
三大新型AI推理芯片Groq、Cerebras、Sambanova已经把DeepSeek-R1-Distill Llama-70B搞到了每秒500-1500tokens。
快到你都看不清发生了什么,推理思维链完成了、代码写完了,一眨眼直接运行了。
One More Thing
还有一条有意思的消息,ai.com域名现在已定向到DeepSeek官网。
甚至有传言称是DeepSeek重金拿下了该域名。
不过一直关注大模型的朋友可能还记得,这个域名曾先后定位到ChatGPT和xAI。
大概率是域名所有人个人行为~
国家超算互联网平台
https://www.scnet.cn/
腾讯云DeepSeek专题
https://cloud.tencent.com/developer/special/deepseek
阿里云DeepSeek解决方案
https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms
商汤大装置
https://www.sensecore.cn
参考链接:
[1]https://x.com/AnushElangovan/status/1888006978959741390
[2]https://x.com/Dev__Digest/status/1887337604267332022
— 完 —
轻松完成“小目标” !当当创始人李国庆淘宝首播:销售额破亿元
快科技11月5日消息,又一商界大佬在淘宝直播带货了,李国庆前不久在淘宝首次开播,主推酒水直播。最终李国庆淘宝直播首秀交出了破亿的成绩单,完成了一个亿的小目标”开播仅一个小时,销售额就突破3000万元,等到直播结束时,茅台、五粮液、泸州老窖、郎酒,几乎所有上播的商品都被卖空了。据了解,李国庆给这次直播首秀定了一个非常高的目标,希望奠定茶酒直播一哥”的地位,结果也没有令其失望。0000《封神2》崩的越惨,DeepSeek的刀就越锋利。
这篇文章可能观点会有点偏激,但是想了想,还是决定写下来,不吐不快。事情的起因,正是前天和昨天终于抽空去看了下电影。小城市里,《哪吒2》实在买不到时间合适的票,想着回北京再看了,就先看了《唐探1900》和《封神2》。0001图片、视频直接生成3D高斯分布!免费体验,已正式商用
图源备注:图片由AI生成,图片授权服务商Midjourney知名3D扫描应用企业Polycam在官网宣布,结束对3DGAUSSIANSPLATS(以下简称“3DGS”)的测试,正式投入商业使用。站长网2023-11-12 10:39:0400011法拉第未来被限制高消费:国内公司已被强制执行超31万元
近日,FaradayFuture(法拉第未来)在中国的关联公司法法汽车(中国)有限公司及其法定代表人王志刚因未履行法律文书确定的给付义务,被采取了限制高消费的措施。这起涉及劳动争议和人事争议的案件中,申请人为葛某。相关案件流程信息显示,该公司已于今年8月因相同案件被法院强制执行,执行金额超过31万元。0000“大海捞针”实验验证RAG+GPT-4 Turbo模型卓越性能 只需4%的成本
要点:1.RAGGPT-4Turbo实现了性能飙升,只需4%的成本,通过“大海捞针”实验证明其卓越效果。2.下一阶段的LLM重点在于生成超具体的响应,通过上下文窗口填充、RAG和微调等技术实现不同使用情境下的个性化响应。3.在“大海捞针”实验中,RAG模型表现出色,准确性接近完美,成本仅为GPT-4Turbo的4%,而延迟方面也有良好表现。站长网2023-12-08 14:57:150002