英伟达展示 Hopper 超级计算机,Intel Gaudi2 的性价比是 H100 的 4 倍
在最新一轮 MLPerf 训练 v3.1 的结果中,尽管大部分成绩并不激动人心,但两个结果引人注目。首先,NVIDIA (英伟达)使用 MLPerf 来展示其最新的霍珀(Hopper)一代超级计算机。其次,非常少见的是,英特尔和 NVIDIA 都在宣传英特尔 Gaudi 2 加速器在价格/性能方面的出色表现。
在封闭部门和开放部门之间,共有 209 个结果跑过 83 种不同的配置。开放部门仅提交了两种配置,每种配置只有一个不同的结果。MLPerf 训练 v3.1 有九个测试,所以平均每个提交配置的基准测试完成率只有约 27%。209 个结果中只有 14 个不是 NVIDIA 的 GPU。其中六个是英特尔展示了其 Xeon Sapphire Rapids 在 AI 中的性能,为行业 CPU 性能设定了基线。
第一个重要的信息是,NVIDIA 正在展示其新的超级计算机。这台被称为 NVIDIA Eos 的系统配备了 10,752 个 H100 GPU,通过 400Gbps Quantum-2 InfiniBand 连接。从某种角度看,如果一家公司要在开放市场上购买这样的系统,其价格很可能超过 4 亿美元。
有了这台庞大的超级计算机,NVIDIA 在 MLPerf 训练套件中赢得了不同 GPU 数量的胜利。它甚至与运行 10,752 NVIDIA H100 GPUs 的 Microsoft Azure 云服务相匹配。
一般来说,提交 MLPerf 训练结果的其他公司如此之少,以至于 NVIDIA 不得不制作一个总结幻灯片,显示很少有其他公司使用其 MLPerf 训练套件。从 AMD 的财报中可以知道,它正在出货 MI300 变体,这将是 MLPerf 的「商业可用」产品。我们还知道,像 Cerebras 这样的公司没有 MLPerf 就售出了价值 10 亿美元以上的晶圆规模集群。MLPerf 推理通常非常适合供应商之间的比较。MLPerf 训练已经失去了这一点,除了一个例外。
查看 Stable Diffusion 测试,人们可能会看到 NVIDIA 的速度大约是英特尔 Gaudi2 的 8 倍。然而,当我们了解细节时,NVIDIA 使用的 H100 GPU 数量是英特尔的 16 倍才能达到这种速度提升。把这个放在一个视角中,我们预期的是,要快 8 倍,成本会超过 32 倍。换句话说,NVIDIA 的营销幻灯片在这里显示,与 NVIDIA 相比,英特尔在每美元性能方面的表现介于相当接近和 4 倍之间(约 8 倍的性能,约 32 倍的成本)。
在 64 个加速器的直接比较中,NVIDIA 大约快两倍。这对英特尔来说是一个很好的结果,因为它使用的加速器成本不到 NVIDIA 对手的一半,而且系统架构要简单得多。
NVIDIA 在调整 H100 方面比英特尔在 Gaudi2 方面更进一步,但此次 MLPerf 的重大进展是支持 FP8,这导致了约 2 倍的性能提升。
英特尔现在有了一个有趣的玩法。Gaudi2 的表现似乎介于 A100 和 H100 之间,但从了解的情况来看,它的成本不到 NVIDIA的 H100 部分的一半,如果考虑到整个系统成本,可能会更低。
英特尔 Gaudi2 获得了足够的关注,以至于供应受限,但没有 H100 那么严重。
除了 NVIDIA 之外,大部分行业都放弃了 MLPerf 训练,只剩下一些英特尔的结果和一个 Google 的结果。NVIDIA H100 SXM5 是当今的大型 GPU,很少有使用 MLPerf 挑战它的。只有少数公司能够将其硬件和软件扩展到超过 1000 个加速器,所以在顶端,竞争并不激烈。如果您六个月后想要 10000 个加速器,那么您很可能是在购买 NVIDIA H100 SXM5 系统。
拥有 NVIDIA Eos 超级计算机,NVIDIA 拥有一台内部价值超过 4 亿美元的机器。目前,可能没有其他任何公司能够在这一点上与之匹敌。当然,这是零售价值,不是 NVIDIA 支付自己部件的价格,但这是一台大机器。
NVIDIA 争夺规模的有趣结果是,它展示了英特尔的 Gaudi 2 可以以四倍的性价比提供 Stable Diffusion 性能。NVIDIA 试图展示它在图表上有一个更长的条形图,但在争取更长条形图的比赛中,它失去了规模效率,给了英特尔一个大胜利。
Claude iOS版本突然推出!11MB大小,体验丝滑,网友呼吁语音功能快上线
Claude,深夜突然大放送iOS版本!就在几小时前,Anthropic官方突然给家人们送福利,官宣Claude正式推出iOSAPP,只有11MB。如此一来,可真像其官方说得那样:“前沿情报的力量,现在就在你的口袋里。”虽然Claude的手机版本上线显得有些姗姗来迟——去年5月,其最大劲敌OpenAI就推出了iOSAPP,但大多数用户们显然还是很开心这一操作。站长网2024-05-04 12:36:230000Redmi K70系列宣布明天OTA升级!手机屏幕频闪更低更护眼
快科技12月14日消息,今日晚间,Redmi市场总经理王腾宣布,明天开始正式推送OTA升级,升级后RedmiK70系列的SVM值将做到0.1以内,让SVM值比友商更低。另外,王腾还对屏幕SVM、SVM测试方法进行了详细科普。据介绍,SVM是照明协会的认证数值,1以下即是符合护眼规范,以往照明设备会有频率闪烁问题,而且是整面照明同步亮同步暗的状态。0000免费AI贴纸工具Sticker.Show 支持中文输入
Sticker.Show是一款免费的在线贴纸制作工具,为用户提供了便捷的个性化体验。不论是个人还是商业用户,都能在该平台上轻松创作符合自己需求的定制贴纸。体验地址:https://top.aibase.com/tool/sticker-show用户只需在输入框中输入或粘贴文本,即可生成各式各样的贴纸,而且支持中文输入。操作简单高效,无需复杂的设计技能,任何人都可以快速上手制作自己想要的贴纸。站长网2024-03-20 10:31:570000小红书粉丝最多的品牌号,做对了什么?
最近,因为和中国邮政联名开店,蜜雪冰城又被年轻人疯狂玩梗。在小红书上,蜜雪冰城也主动用了“雪雪我啊,瞒不住了”这样的文案,来回应网友的调侃,单条笔记点赞达到8.7万,加上用户乐意将蜜雪冰城和瑞幸组CP,因此评论区精彩纷呈。“善于玩梗和接梗”的品牌气质,让蜜雪冰城在小红书收获了诸多好评,其开设的两个品牌账号,粉丝量皆位居小红书品牌号头部。@蜜雪冰城小红书笔记截图站长网2023-08-09 20:03:270000NVIDIA 自动引导技术:改善扩散模型中的图像质量和变化
划重点:-💡NVIDIA提出的自动引导方法在扩散模型中使用较小的模型来引导生成过程,显著改善了图像生成的质量和多样性。-💡通过自动引导方法,研究人员在ImageNet-512和ImageNet-64等基准测试中取得了新的记录成绩,实现了对图像生成质量的显著提升。-💡这一创新方法在解决当前方法存在的局限性的同时,为生成高质量和多样化图像提供了更高效、更有效的解决方案。站长网2024-06-08 09:51:460000