谷歌AI芯片TPU v5p在训练LLM方面比其前一代快2.8倍

站长网2024-01-29 10:41:150阅

谷歌正迅速成为其最好的朋友英伟达的强大对手——其超级计算机所使用的TPU v5p人工智能芯片比以往任何时候都更快、更大、更宽，甚至超过了强大的H100。谷歌在最近推出其Gemini人工智能模型的同时，也发布了其最新版本的旗舰张量处理单元（TPU），用于人工智能的训练和推理，这似乎是一种挑战英伟达自己的市场领先的图形处理器（GPU）的尝试。

图源备注：图片由AI生成，图片授权服务商Midjourney

TPU v5p是谷歌最强大的定制设计的人工智能加速器，已经被部署到了该公司的“人工智能超级计算机”上。这是一种专门为运行人工智能应用而构建的超级计算架构，而不是通常运行科学工作负载的超级计算机，因为TPU不适合这些工作。

其最新版本的TPU每个单元（组成系统的部分）有8， 960 个芯片，相比之下，v4 只有4， 096 个，而且在每个单元可用的浮点运算次数（FLOPs）方面，它的可扩展性是v4 的四倍。这些新的单元提供了4，800Gbps的吞吐量。新的单元还拥有95GB的高带宽内存（HBM），而TPU v4 只有32GB的HBM RAM。

不同于英伟达，它将其GPU出售给其他公司，谷歌的定制TPU仍然只在其自己的产品和服务中使用。谷歌的TPU长期以来一直用于为其服务提供动力，包括Gmail、YouTube和Android，而最新版本也被用于训练Gemini。

谷歌的v5p TPU在训练大型语言模型方面比TPU v4 快2. 8 倍，并且提供2. 1 倍的性价比。虽然今年早些时候发布的中间版本TPU v5e在三者中提供了最高的性价比，但它只比TPU v4 快1. 9 倍，这使得TPU v5p成为最强大的。

它甚至强大到足以与英伟达广受欢迎的H100 GPU相媲美，这是市场上最适合人工智能工作负载的显卡之一。根据该公司自己的数据，这个组件在训练工作负载方面比英伟达的A100 GPU快四倍。

与此同时，谷歌的TPU v4 据估计比A100 快1. 2 到1. 7 倍，这是根据它在四月份发布的研究结果。粗略的计算表明，TPU v5p大约比A100 快3. 4 到4. 8 倍，这使得它与H100 相当或者更优秀，尽管在得出任何结论之前，需要更详细的基准测试。

谷歌AI芯片TPUv5p在训练LLM方面比其前一代快28倍

0000

评论列表

共(0)条

相关推荐

阿布扎比推出人工智能公司 A171，与 OpenAI 竞争
划重点:🔸阿布扎比推出人工智能公司A171，将与OpenAI等AI研究公司展开竞争。🔸A171是阿布扎比技术创新研究所（TII）领导的广泛人工智能研究和开发项目的成果。🔸A171将专注于市场营销和支持Falcon大型语言模型（LLM），该模型是TII今年早些时候推出的。
站长网站长资讯2023-11-28 18:10:23
0000
站长资讯
拎包入住！“京东青年城”投入60亿建近4000套公寓
5月4日，京东官方宣布“京东青年城”正式启动。
站长网2023-05-05 10:21:15
0000
当腰部达人成为“中流砥柱”，我们需要关注什么？
近年，众多腰部达人声量渐起，逐渐被用户和品牌“看见”。对于品牌来说，优质的腰部达人粉丝粘性好、创作者群体体量大，合作性价比很高。对于用户来说，优质的腰部达人往往活跃度高、作品形式丰富、与粉丝的互动更多。一手连接用户，一手连接品牌的腰部达人，在平台“润物无声”的“推波助澜”下，逐渐成为了内容平台的“中流砥柱”。
站长网站长资讯2024-01-03 17:40:11
0000
站长资讯
微信下架多个违规微短剧类小程序：内容侵权、不良导向
快科技12月6日消息，今日，微信珊瑚安全公众号发布12月违规微短剧类小程序的处置公告，多部微短剧、侵权小程序被下架。官方表示，近期平台通过巡查审核发现，部分微短剧类小程序存在未进行剧目合规备案、不良导向价值观内容或存在侵权等行为。根据国家相关法律法规要求以及《腾讯微信软件许可服务协议》《微信小程序运营规范》的相关规定，平台下架了部分违规微短剧剧目，并对相关违规小程序进行处置。
站长网2024-12-09 09:38:46
0000
站长资讯
Midjourney V6动漫微调模型Nijijourney V6正式上线
终于，MidjourneyV6的动漫微调模型NijijourneyV6正式上线了!这个新版本对提示词的响应更加出色，同时还能识别更多的风格。现在，用户可以通过在/settings中选择NijijourneyV6版本，或者使用Niji的discord机器人来体验这一全新的功能。
站长网2024-01-30 10:24:51
0002