首页站长资讯老黄H100再破纪录，4分钟训完GPT-3！全新「特供版」H20、L20和L2曝光，性能史诗级缩水

老黄H100再破纪录，4分钟训完GPT-3！全新「特供版」H20、L20和L2曝光，性能史诗级缩水

站长网2023-11-10 16:10:320阅

H100再次在MLPerf中刷新了记录!

英伟达超算NVIDIA Eos在GPT-3模型的基准测试中，只用了3.9分钟就完成了训练。

这比6月份的刷新记录的成绩——10.9分钟，提升了近3倍。

Eos使用了多达10，752个H100和NVIDIA Quantum-2InfiniBand网络互连。

通过推算，Eos现在可以在短短8天内进行训练，比之前使用512个A100GPU的先进系统快73倍。

在本轮新的生成式AI测试中，1，024个NVIDIA Hopper架构GPU在2.5分钟内完成了基于Stable Diffusion文本到图像模型的训练基准测试，为这一新工作负载设定了高标准。

与此同时，外媒曝光了英伟达为应对新规而打造的全新「特供版」芯片——H20、L20和L2。

系统扩展效率飙升93%

最新的结果部分是由于使用了有史以来应用于MLPerf基准测试的最多加速器。

10，752个H100GPU远远超过了6月份AI训练的规模，当时英伟达使用了3，584个Hopper GPU。

GPU数量扩展3倍，性能扩展了2.8倍，效率达到93%，这在一定程度上要归功于软件优化。

高效扩展是生成式AI的关键要求，因为LLM每年都在以一个数量级的速度增长。

最新结果显示，即使是世界上最大的数据中心，英伟达也有能力应对这一前所未有的挑战。

这一成就归功于加速器、系统和软件创新的全栈平台，Eos和Microsoft Azure在最近一轮测试中都使用了该平台。

Eos和Azure在各自的提交中都采用了10，752个H100。它们的表现相差不到2%，展示了英伟达AI在数据中心和公有云部署中的高效性。

英伟达依靠Eos完成了各种关键任务。

它有助于推进NVIDIA DLSS和ChipNeMo等计划，后者是帮助设计下一代GPU的生成式AI工具。

9项基准测试，刷新记录

除了在生成式AI方面取得进步，英伟达在这一轮测试中还刷新了几项新的记录。

比如，在训练推荐系统模型的测试中，H100GPU比上一轮快了1.6倍。在计算机视觉模型RetinaNet的测试中，性能提高了1.8倍。

这些性能提升来源于软件和硬件规模扩充的优化结合。

英伟达再次成为唯一一家完成了所有MLPerf测试的公司。H100在9项基准测试中展示了最快的性能和最大的扩展性。

这些加速为用户训练大模型或用NeMo等框架自定义模型以满足业务需求，带来了更快上市时间、更低成本和节省能源。

这一轮测试中，包括华硕、戴尔技术、富士通、技嘉、联想、QCT和超微等11家系统制造商在提交结果中使用了NVIDIA AI平台。

特供版H20、L20和L2性能曝光

在过去几年中，美国对高性能硬件出口实施了非常严格的限制。

尤其是在2023年11月生效的新规，更是要求所有达到一定总处理性能和/或性能密度的硬件都必须获得出口许可。

据最新泄露的文件和四位熟悉内情的人士透露，为了遵守美国的出口管制，英伟达已经推出了三款全新的「中国定制版」芯片——HGX H20、L20PCle 和 L2PCle GPU。

其中，HGX H20配有高达96GB的HBM3显存，以及4TB/s的带宽，并且基于全新的Hopper架构。

与H100的50MB二级缓存相比，H20还拥有更大的60MB二级缓存。

然而在性能方面，HGX H20只能提供FP64精度1TFLOPS（H100为34TFLOPS）和FP16/BF16精度148TFLOPS（H100为1，979TFLOPS）的算力。

由此，功耗也从700W降到了400W。

有趣的是，基于安培架构并配备24GB HBM2的入门级A30GPU，在FP64和FP16/BF16精度下，都要比HGX H20快不少。

至于L20和L2PCIe GPU，则是基于阉割后的AD102和AD104核心，对应的是与L40和L40S相同的市场。

更直观地，RTX4090采用的便是AD102的变体，而4070和4070Ti则是基于AD104的变体。

除此之外，为了遵守新规，HGX H20、L20PCle和L2PCle GPU不仅性能是残血的，而且还只配备了残血版的NVLink连接。

老黄H100再破纪录4分钟训完GPT3 全新 特供版H20L20和L2曝光性能史诗级缩水

0000

评论列表

共(0)条

相关推荐

站长资讯
小米YU7冬测！雷军、卢伟冰现身黑河：一起放加特林烟花
快科技1月12日消息，今日，抖音网友不会开车的杨桃”发布视频作品，称在生日这天最牛的活动是和雷总一起放烟花。作品显示，该视频拍摄于1月11日，地点位于黑龙江省黑河市，小米CEO雷军、小米总裁卢伟冰、小米战略市场部副总经理徐洁云等人现身，在一处空地放加特林”烟花。在这条视频作品的评论区，还有网友晒出雷军一行人在黑河逛俄罗斯商品街的照片。
站长网2025-01-12 11:26:46
0000
谷歌超过四分之一的新代码由人工智能生成
谷歌正在开发一系列人工智能产品，并在开发过程中大量使用人工智能。首席执行官SundarPichai在公司2024年第三季度财报电话会议上表示，谷歌超过四分之一的新代码都是由人工智能生成的，然后由工程师审核和接受。这标志着人工智能对公司的重要性。
站长网站长资讯2024-10-30 10:00:15
0000
站长资讯
AMD收购开源AI软件企业Nod.ai 加速AI硬件优化
文章概要:-AMD收购创立仅3年的Nod.ai，显示其正竞相AI芯片快速增长的市场。-Nod.ai软件可加速AI模型部署于AMD各类硬件平台。-AMD力图利用Nod.ai的工程人才，提升开源开发者声誉。AMD宣布计划收购Nod.ai，这是一家专门针对高性能硬件优化人工智能软件的初创公司。
站长网2023-10-11 16:51:24
0000
站长资讯
意大利数据保护监管机构指责OpenAI违反GDPR规定
**划重点:**1.🕵️意大利数据保护机构正式起诉OpenAI，指称其ChatGPT违反GDPR规定。2.💻调查源于去年，指责ChatGPT在大规模处理意大利人个人信息时违反了GDPR规则。3.🌐OpenAI可能面临高达2千万欧元或全球年收入的4%的罚款，同时未获得数百万欧洲公民的同意处理其个人数据。
站长网2024-01-30 10:09:31
0000
站长资讯
报告：桌面GPU出货量飙升三分之一，但这并非AI PC的功劳
**划重点:**1.📈消费级GPU出货量在2023年第四季度同比增长32%，达到950万台，季度环比增长6.8%。2.🤖分析师认为，虽然AIPC备受瞩目，但并非推动GPU销售增长的主要因素，而是价格下降和可用性提高。3.🔄AMD在假期季度取得最大增长，而Nvidia仍然保持着在桌面图形领域的主导地位，市场份额为80%。
站长网2024-03-07 14:50:24
0000