研究称:英特尔Gaudi2技术在大语言模型推理方面媲美英伟达AI加速器
划重点:
- 📌 研究显示,英特尔的 Gaudi2技术在大规模语言模型推理方面与英伟达的 AI 加速器相媲美。
- 📌 Gaudi2的推理性能在解码方面与英伟达 H100系统相当,并且优于英伟达 A100。
- 📌 根据公共云定价,Gaudi2在训练和推理方面的性价比都超过了英伟达的 A100和 H100。
根据 Databricks 的最新研究,英特尔的 Gaudi2技术在大规模语言模型推理方面与业界领先的英伟达 AI 加速器相媲美。该研究发现,Gaudi2在解码方面的延迟与英伟达 H100系统相当,并且优于英伟达 A100。研究还发现,Gaudi2的推理性能比 H100和 A100实现了更高的内存带宽利用率。
不过,英伟达在顶级加速器的训练性能上仍然更强大。研究人员使用 Databricks 的 MosaicML LLM 工厂进行训练,发现 Gaudi2在单节点 LLM 训练性能方面仅次于英伟达 H100,达到了每芯片超过260TFLOPS 的性能。总体而言,根据公共云定价,Databricks 的研究报告显示,与 A100和 H100相比,Gaudi2在训练和推理方面具有最佳的性价比。
英特尔通过 MLcommons MLperf 基准测试来提供有关 Gaudi2训练和推理性能的自己的测试结果。Databricks 的新数据进一步验证了英特尔的 Gaudi 技术在性能方面的表现,这是来自第三方的验证。
英特尔在2019年以20亿美元收购了 AI 芯片初创公司 Habana Labs 及其 Gaudi 技术,并在此后几年中不断改进这项技术。厂商们通过参与行业标准基准测试来证明性能。无论是英伟达还是英特尔都经常参与 MLcommons MLPerf 的训练和推理基准测试,这些基准测试每年更新多次。在去年11月发布的最新的 MLPerf3.1训练基准测试中,英伟达和英特尔都声称刷新了 LLM 训练速度记录。几个月前的去年9月,也发布了 MLPerf3.1推理基准测试,英伟达和英特尔在该测试中也表现出了强劲的竞争性能。
虽然像 MLPerf 和 Databricks 的研究报告这样的基准测试非常有价值,但 Medina 指出,许多客户依靠自己的测试来确保硬件和软件堆栈适用于特定的模型和用例。他表示,软件堆栈的成熟度非常重要,因为人们对基准测试组织存在怀疑,厂商会对其进行优化以满足特定的基准测试要求。
据 Medina 介绍,MLPerf 是有其一定作用的,因为人们知道要提交结果,技术堆栈需要达到一定的成熟度水平。但他强调,客户不会依靠 MLPerf 的结果来做出业务决策。“MLPerf 的结果只是组织在进行测试之前使用的成熟度过滤器”,Medina 说道。
就在准备于2024年推出 Gaudi3AI 加速器技术之际,有关 Gaudi2的新数据也发布出来了。Gaudi2是采用7纳米工艺开发的,而 Gaudi3基于5纳米工艺,并将提供4倍的处理能力和双倍的网络带宽。Medina 表示,Gaudi3将于2024年发布并开始大规模生产。“Gaudi3是一个将 Gaudi2的性能优势发挥到极致的产品,它在性能上有了巨大的飞跃,从而在性价比和性能功耗比方面带来了优势。”
英特尔正在致力于将公司的高性能计算和 AI 加速器技术融合在一起。英特尔也继续看好其用于 AI 推理工作负载的 CPU 技术。英特尔最近宣布推出带有 AI 加速功能的第五代 Xeon 处理器。
“CPU 在推理中仍然占有相当大的比例,甚至微调在 CPU 上也可能有优势”,Medina 说道。“CPU 参与数据准备,并且当 AI 的计算密度极高时,它们与 Gaudi 加速器一起提供解决方案。因此,我们的总体策略是提供一系列解决方案。”
Chrome浏览器将推出新“高级”设置 整合智能功能
谷歌Chrome浏览器正在开发一个名为“高级”的新设置界面,整合其在人工智能方面的各项新功能。据浏览器专家透露,新的高级设置页面网址为chrome://settings/ai。高级设置预计会包含Chrome的两大新智能工具:标签页面自动分类和智能表单填充。标签页面工具能够在打开大量标签后,自动进行分组归类,方便用户组织管理。智能表单填充功能则可以更准确地填写网页中的表单,提高用户效率。站长网2023-11-23 10:17:080000产业链人士:苹果 iPhone 15 Pro 系列取消固态按键设计属实 延后可能性大
日前分析师郭明錤分享的最新信息称,下一代iPhone15Pro和iPhone15ProMax将不再采用固态按钮,原因是「在大规模生产前尚未解决技术问题」。站长网2023-04-13 08:58:340000直击技术发展机遇和挑战,ChatGPT边界何在?
ChatGPT是今年科技圈最大的焦点。一方面,国内的科技巨头纷纷跟进,如百度发布文心一言、昆仑万维推出“天工”3.5、阿里发布“通义千问”等;另一方面,王小川、王慧文等互联网老兵加入到做大语言模型创业公司的行列中。0000三星电子举办 2023 年三星人工智能论坛,展示人工智能和计算机工程的关键进展
三星电子日前在韩国京畿道水原会展中心开幕了三星AI论坛,分享人工智能(AI)与计算机工程(CE)领域的最新研究成果,这对提升公司的下一代半导体技术具有重要贡献。站长网2023-11-08 11:44:290000Clippah:快速、简单、高效的AI视频编辑器,让你轻松制作精美视频
Clippah是一款人工智能视频编辑器,能够提供快速、简单和高效的视频编辑体验。Clippah强大的算法能够自动裁剪视频、调整相机、音效和颜色,从而节省用户大量的时间和精力。用户可以利用Clippah轻松创建和编辑高质量的视频内容。体验地址:https://www.clippah.co/站长网2023-09-07 10:19:510000