MLPerf放榜!AI芯片公司墨芯人工智能再夺MLPerf大模型推理三项冠军
站长网2023-09-15 09:32:080阅
要点:
MLPerf公布最新GPT大模型推理测试结果,墨芯人工智能S30计算卡单卡、4卡、8卡的算力均获得第一。
墨芯通过独创的双稀疏算法与硬件协同设计,在GPT-J大模型上取得1.8倍于英伟达H100的性能优势。
墨芯的成绩证明,稀疏计算是大模型时代算力发展的关键,可根本解决大模型参数增长与算力瓶颈的矛盾。
最新MLPerf推理测试结果公布,墨芯人工智能再次夺冠,其S30计算卡在GPT-J大模型的单卡、4卡、8卡推理性能均位居第一。此前墨芯已在MLPerf上连续两届夺冠。
在60亿参数GPT-J模型上,墨芯通过独创的双稀疏算法与硬件协同设计,实现了高达1.8倍于4nm制程英伟达H100的性能优势。
墨芯的成绩证明,稀疏计算技术是大模型时代的关键,可减少模型计算量,缓解算力需求激增、功耗过大等痛点,为大模型在参数量层面取得飞跃提供可能。墨芯已推出支持多种大模型的AI计算平台,性能高、效率优。
业界认为,墨芯等稀疏计算创新,将引领大模型应用深入各行各业。MLPerf成绩是对墨芯产品实力的肯定,也印证稀疏计算将助力大模型算力实现根本性变革。
0000
评论列表
共(0)条相关推荐
会玩!一国外AI公司称要在海上训练强大的AI以规避美国法规
划重点:1.自称是AI公司DelComplex表示将在国际水域上建立具有安全保障力量的“蓝海前沿计算集群”(BSFCC),以规避政府的AI培训报告要求。2.DelComplex可能并非真正的AI公司,其宣称的驳船也是虚构的。3.该公司声称其行为是为了提供“国家即服务”,并批评政府对AI技术的监管滞后于时代发展。站长网2023-11-02 11:57:280000苹果新专利可识别用户状态 通过瞳孔等识别是否分心等
近日,苹果公司公布了一项识别用户状态的专利。该专利名为“利用亮度变化来确定用户特征”,涉及用亮度变化来确定用户特征。专利摘要显示,本文公开的一些实施方式基于用户对其中一部分或全部内容快速变得更亮或更暗的亮度变化事件的生理(例如,瞳孔)响应来识别用户的状态(例如,专心、分心、走神等)。站长网2023-04-12 13:29:490000iPhone mini“重出江湖”?15系列阵列遭爆料,网友:库克真会整活
去年的iPhone14系列产品线路有所调整,取消小屏的mini,取而代之的是大屏Plus。这也是库克用mini实践得出来的机型,既然小屏叫好不叫座,那就干脆来个大屏?但iPhone14Plus明显遇冷,一经上市立刻破发。截止目前,128G版本iPhone14Plus的市场价格要比官网便宜800元左右,512G版本更是骤降超千元。站长网2023-05-23 12:23:000003MLC 项目使得 AMD GPU 在 LLM 推理方面具有竞争力
站长之家(ChinaZ.com)8月11日消息:AMDGPU通过MLC(Machinelearningcompilation)项目在编译和部署大模型方面取得了进展,实现了与英伟达GPU相当的性能。MLC-LLM方案在AMDRX7900XTX上的性能达到了英伟达GeForceRTX4090的80%,而价格只有RTX4090的60%。站长网2023-08-11 17:43:130000上线AI Studio社区,百度要做大模型“盟主”
AI大模型要怎么变现,这是一个如今AI领域创业者下意识回避、却又不得不面对的问题。诸如ChatGPTPlus这类付费增值服务终究只是杯水车薪,效仿苹果AppStore、谷歌PlayStore做分发平台可能才是正途,并且这也是该行业领头羊OpenAI目前正在做的事情。继OpenAI推出插件支持、开放API,开始做平台后,国内的相关厂商也有样学样。站长网2023-08-28 13:57:010000