研究称:英特尔Gaudi2技术在大语言模型推理方面媲美英伟达AI加速器
划重点:
- 📌 研究显示,英特尔的 Gaudi2技术在大规模语言模型推理方面与英伟达的 AI 加速器相媲美。
- 📌 Gaudi2的推理性能在解码方面与英伟达 H100系统相当,并且优于英伟达 A100。
- 📌 根据公共云定价,Gaudi2在训练和推理方面的性价比都超过了英伟达的 A100和 H100。
根据 Databricks 的最新研究,英特尔的 Gaudi2技术在大规模语言模型推理方面与业界领先的英伟达 AI 加速器相媲美。该研究发现,Gaudi2在解码方面的延迟与英伟达 H100系统相当,并且优于英伟达 A100。研究还发现,Gaudi2的推理性能比 H100和 A100实现了更高的内存带宽利用率。
不过,英伟达在顶级加速器的训练性能上仍然更强大。研究人员使用 Databricks 的 MosaicML LLM 工厂进行训练,发现 Gaudi2在单节点 LLM 训练性能方面仅次于英伟达 H100,达到了每芯片超过260TFLOPS 的性能。总体而言,根据公共云定价,Databricks 的研究报告显示,与 A100和 H100相比,Gaudi2在训练和推理方面具有最佳的性价比。

英特尔通过 MLcommons MLperf 基准测试来提供有关 Gaudi2训练和推理性能的自己的测试结果。Databricks 的新数据进一步验证了英特尔的 Gaudi 技术在性能方面的表现,这是来自第三方的验证。
英特尔在2019年以20亿美元收购了 AI 芯片初创公司 Habana Labs 及其 Gaudi 技术,并在此后几年中不断改进这项技术。厂商们通过参与行业标准基准测试来证明性能。无论是英伟达还是英特尔都经常参与 MLcommons MLPerf 的训练和推理基准测试,这些基准测试每年更新多次。在去年11月发布的最新的 MLPerf3.1训练基准测试中,英伟达和英特尔都声称刷新了 LLM 训练速度记录。几个月前的去年9月,也发布了 MLPerf3.1推理基准测试,英伟达和英特尔在该测试中也表现出了强劲的竞争性能。
虽然像 MLPerf 和 Databricks 的研究报告这样的基准测试非常有价值,但 Medina 指出,许多客户依靠自己的测试来确保硬件和软件堆栈适用于特定的模型和用例。他表示,软件堆栈的成熟度非常重要,因为人们对基准测试组织存在怀疑,厂商会对其进行优化以满足特定的基准测试要求。
据 Medina 介绍,MLPerf 是有其一定作用的,因为人们知道要提交结果,技术堆栈需要达到一定的成熟度水平。但他强调,客户不会依靠 MLPerf 的结果来做出业务决策。“MLPerf 的结果只是组织在进行测试之前使用的成熟度过滤器”,Medina 说道。
就在准备于2024年推出 Gaudi3AI 加速器技术之际,有关 Gaudi2的新数据也发布出来了。Gaudi2是采用7纳米工艺开发的,而 Gaudi3基于5纳米工艺,并将提供4倍的处理能力和双倍的网络带宽。Medina 表示,Gaudi3将于2024年发布并开始大规模生产。“Gaudi3是一个将 Gaudi2的性能优势发挥到极致的产品,它在性能上有了巨大的飞跃,从而在性价比和性能功耗比方面带来了优势。”
英特尔正在致力于将公司的高性能计算和 AI 加速器技术融合在一起。英特尔也继续看好其用于 AI 推理工作负载的 CPU 技术。英特尔最近宣布推出带有 AI 加速功能的第五代 Xeon 处理器。
“CPU 在推理中仍然占有相当大的比例,甚至微调在 CPU 上也可能有优势”,Medina 说道。“CPU 参与数据准备,并且当 AI 的计算密度极高时,它们与 Gaudi 加速器一起提供解决方案。因此,我们的总体策略是提供一系列解决方案。”
京东618上线“苹果大额券” iPhone14Pro 系列至高优惠1800元
京东官方今日宣布,“618优惠提前享”第二波已经上线。打开京东App首页搜索“苹果大额券”直达618活动会场。活动时间为5月25日至27日的每天0点、10点和20点,iPhone14Pro系列至高优惠1800元。站长网2023-05-25 09:01:370002谷歌母公司总裁:美国AI不会永远领先中国 甚至还可能略逊一筹
快科技1月22日消息,据媒体报道,谷歌母公司Alphabet总裁兼首席投资官鲁斯波拉特(RuthPorat)近日表示,在AI开发竞赛中,美国未必能保证维持对中国的领先优势。波拉特在接受采访时指出:美国的这一优势并非板上钉钉。”她认为,西方在芯片方面确实领先,我们的模型可能领先一年多,但在所谓的基本能力扩散方面,中国与美国不相上下,甚至可能略胜一筹”。0000京东天猫红包20/21点加码!1.1元起无门槛:95%中奖率
20点-20点半,天猫可抽一次加码红包,人人可领,中奖率95%。1.1元起无门槛红包10万个11.1元红包,限时不限量。天猫21点再加抽30万个大额猜猜猜红包,此类红包日常面额5元起。另外,20点京东无门槛红包限时加码额外抽一次,拼手速抢大量1.1~3元红包。天猫双11红包:点此抽红包(每天可抽1次)或淘宝APP搜索我要领红包7707”站长网2023-11-09 21:48:040000OpenAI大地震一分为二,全力冲刺AGI!一半向钱看,一半装理想
终于,OpenAI确认裂变!从此,公司一分为二,一部分是营利机构,另一部分则是非营利。经过几个月的传闻后,OpenAI的改组终于尘埃落定——OpenAI的营利性部门将转变为特拉华州公共利益公司(PBC),使其能够同时追求利润和社会影响。而营利性部门的成功,将用于支持更强盛的非营利事业。站长网2024-12-29 10:23:590000AI幻觉之争!周鸿祎碰撞李彦宏又唱反调
快科技11月21日消息,在2024世界互联网大会乌镇峰会期间,360集团创始人周鸿祎就百度创始人李彦宏在百度世界大会上关于大模型已基本解决幻觉问题”的言论,表达了自己的不同看法。周鸿祎首先对李彦宏表示了尊重,但随后指出,幻觉是大模型的一种固有特性,而非缺点。0000