英伟达GH200在MLPerf 3.1中惊艳亮相,性能相比H100跃升17%
要点:
英伟达最新发布的GH200Grace Hopper超级芯片,在MLPerf3.1基准测试中首次亮相。
GH200的性能比单个H100提升了17%,在各测试项目上表现均超过了H100。
MLPerf Inference3.1新增了大语言模型GPT-J的推理测试,以及更新后的DLRM推理测试。
MLPerf作为业界公认的AI系统性能基准测试,最近发布了3.1版本。此版本中,英伟达最新发布的GH200Grace Hopper超级芯片首次在公开基准中亮相。
测试结果显示,GH200的性能比单个H100GPU提升了17%,在服务器场景的各个测试项目上均具有明显优势。这主要得益于GH200集成了Grace CPU和H100GPU,并通过高达900GB/s的NVLink连接,实现了卓越的CPU-GPU协同计算性能。
此外,MLPerf Inference3.1也做出两点重要更新:
一是新增了GPT-J大语言模型的推理测试;
二是更新了DLRM推理测试的模型和数据集。可以看出,随着硬件性能的进步和AI模型的演进,基准测试也需要不断更新,以更好地评估不同系统在真实应用中的表现。GH200在此次基准测试中的抢眼表现预示着其在AI系统中的强大实力。
英伟达推出的GH200Grace Hopper超级芯片,它将一个H100GPU和Grace CPU集成在一起,通过900GB/s的NVLink-C2C连接。CPU和GPU分别配备了480GB的LPDDR5X内存和96GB的HBM3或者144GB的HBM3e的内存,集成了高达576GB以上的高速访问内存。
GH200Grace Hopper超级芯片专为计算密集型工作负载而设计,能够满足各种严苛的要求和各项功能。它可以训练和运行数万亿参数的大型Transformer模型,或者是运行具有数TB大小的嵌入表的推荐系统和向量数据库。在MLPerf Inference测试中,GH200刷新了英伟达单个H100SXM在每个项目中创下的最佳成绩。
与H100SXM相比,GH200Grace Hopper超级芯片集成了更大的内存容量和更大的内存带宽,使得在NVIDIA GH200Grace Hopper超级芯片上使用更大的批处理大小来处理工作负载。例如,在服务器场景中,RetinaNet和DLRMv2的批处理大小都增加了一倍,在离线场景中,批处理大小增加了50%。
GH200Grace Hopper超级芯片在Hopper GPU和Grace CPU之间的高带宽NVLink-C2C连接可以实现CPU和GPU之间的快速通信,从而有助于提高性能。例如,在MLPerf DLRMv2中,通过PCIe传输一批张量(Tensor)需要22%的批处理推理时间,而使用NVLink-C2C的GH200Grace Hopper超级芯片仅使用3%的推理时间就完成了相同的传输。
由于具有更高的内存带宽和更大的内存容量,与MLPerf Inference v3.1的H100GPU相比,Grace Hopper超级芯片的单芯片性能优势高达17%。此外,英伟达还展示了在目标检测AI网络RetinaNet上,英伟达的产品的性能提高了高达84%。
除了GH200Grace Hopper超级芯片,英伟达还推出了Jetson AGX Orin和Jetson Orin NX模块,为AI应用和机器人应用提供出色的性能。未来的软件优化将进一步释放这些模块中的英伟达Orin SoC的强大潜力。
GPT-4o 17人Omni金牌团队首揭秘!清北上交中科大6位华人领衔
几天前的发布会上,OpenAI再次向全世界证明,它永远走在AI领域的最前沿。眼看着《Her》中的Samantha在自己眼前成真,那一刻,全世界为之振奋。就在刚刚,GPT-4o的关键团队信息,也被公布了出来。就是这个名为「omni」的团队,发挥出了不可思议的潜力,让OpenAI的首个原生全多模态模型成为可能。站长网2024-05-17 09:05:370000精准逃顶!英伟达CEO黄仁勋6月至今套现约6亿美元
快科技9月5日消息,据媒体报道,美国证券交易委员会(SEC)提交的文件显示,英伟达CEO黄仁勋于8月30日至9月3日共售出24万股英伟达普通股,出售股票的价格从107.30美元到120.99美元不等,总价值约2760万美元。0000李飞飞团队推零样本360度场景合成技术ZeroNVS
要点:1.斯坦福和谷歌团队提出了ZeroNVS,一种能够从单个图像实现零样本360度试图合成的新技术。2.ZeroNVS利用3D感知扩散模型和SDS蒸馏来生成逼真且多样化的合成图像,聚焦于场景而不是物体。3.研究人员使用不同的基准数据集进行评估,结果表明ZeroNVS在零样本性能方面明显领先于其他方法,特别是在LPIPS指标上。站长网2023-11-06 09:43:560000StreamRAG:支持搜索视频任意时刻并返回一个视频剪辑
StreamRAG是一个视频搜索和流媒体代理工具,它可以帮助用户在短短2分钟内基于他们的视频数据构建一个个性化的GPT,并且可以和他们的视频进行对话。站长网2024-01-29 11:56:460000披头士乐队的最后一首歌《Now and Then》通过先进的人工智能技术得以完整呈现
站长之家(ChinaZ.com)10月27日消息:通过WingNutFilms的机器学习技术的协助,彼得·杰克逊于2021年导演的披头士纪录片系列《TheBeatles:GetBack》得以在DisneyPlus上呈现。而同样的人工智能技术,也使得披头士乐队的最后一首歌曲得以完整呈现,很快就会与公众见面。站长网2023-10-27 11:25:350000