谷歌AI芯片TPU v5p在训练LLM方面比其前一代快2.8倍
谷歌正迅速成为其最好的朋友英伟达的强大对手——其超级计算机所使用的TPU v5p人工智能芯片比以往任何时候都更快、更大、更宽,甚至超过了强大的H100。谷歌在最近推出其Gemini人工智能模型的同时,也发布了其最新版本的旗舰张量处理单元(TPU),用于人工智能的训练和推理,这似乎是一种挑战英伟达自己的市场领先的图形处理器(GPU)的尝试。

图源备注:图片由AI生成,图片授权服务商Midjourney
TPU v5p是谷歌最强大的定制设计的人工智能加速器,已经被部署到了该公司的“人工智能超级计算机”上。这是一种专门为运行人工智能应用而构建的超级计算架构,而不是通常运行科学工作负载的超级计算机,因为TPU不适合这些工作。
其最新版本的TPU每个单元(组成系统的部分)有8, 960 个芯片,相比之下,v4 只有4, 096 个,而且在每个单元可用的浮点运算次数(FLOPs)方面,它的可扩展性是v4 的四倍。这些新的单元提供了4,800Gbps的吞吐量。新的单元还拥有95GB的高带宽内存(HBM),而TPU v4 只有32GB的HBM RAM。
不同于英伟达,它将其GPU出售给其他公司,谷歌的定制TPU仍然只在其自己的产品和服务中使用。谷歌的TPU长期以来一直用于为其服务提供动力,包括Gmail、YouTube和Android,而最新版本也被用于训练Gemini。
谷歌的v5p TPU在训练大型语言模型方面比TPU v4 快2. 8 倍,并且提供2. 1 倍的性价比。虽然今年早些时候发布的中间版本TPU v5e在三者中提供了最高的性价比,但它只比TPU v4 快1. 9 倍,这使得TPU v5p成为最强大的。
它甚至强大到足以与英伟达广受欢迎的H100 GPU相媲美,这是市场上最适合人工智能工作负载的显卡之一。根据该公司自己的数据,这个组件在训练工作负载方面比英伟达的A100 GPU快四倍。
与此同时,谷歌的TPU v4 据估计比A100 快1. 2 到1. 7 倍,这是根据它在四月份发布的研究结果。粗略的计算表明,TPU v5p大约比A100 快3. 4 到4. 8 倍,这使得它与H100 相当或者更优秀,尽管在得出任何结论之前,需要更详细的基准测试。
新东方及东方甄选捐1000万驰援甘肃
12月18日23时59分,甘肃省临夏回族自治州积石山县发生6.2级地震,震区发生人员伤亡,灾情牵动了全国人民的心。对此,新东方及东方甄选宣布捐款1000万元,驰援甘肃地震灾区。新东方表示,新东方教育科技集团及旗下农产品电商平台东方甄选紧急响应,各捐款500万元,合计1000万元,用于支援甘肃震区的紧急救援、救灾物资采购、受灾群众生活安置及灾后重建等工作。站长网2023-12-19 14:37:360000Move AI推全新Move API 可轻松实现2D转3D
MoveAI近日推出了全新的MoveAPI,该API可以轻松从2D视频中捕捉生成3D运动数据。用户只需使用单一相机即可捕捉人物动作,操作简单,只需上传视频文件即可完成整个过程。MoveAPI自动将视频转换为3D人类运动数据,并提供即时预览,支持导出多种3D文件格式,包括usdz、usdc和fbx,为用户提供了广泛的应用可能性。站长网2024-02-26 11:07:070000新能源品牌周销量来了:比亚迪再次稳居榜首 小鹏杀进第七
快科技10月25日消息,日前,根据各品牌公布的信息我们了解到,在刚刚过去的一周里,新能源汽车的市场发生了很大的变化。从各品牌公布的数据来看,比亚迪依旧稳居榜首,一周卖出了5.19万辆新能源汽车。五菱汽车紧随其后,从上周的第四名成功杀进前三,以0.94万辆的成绩拿下第二,埃安稳扎稳打,以0.93万辆的成绩荣获第三。站长网2023-10-25 20:14:340000今天是iPhone15系列发售日 iPhone 15粉色首销成爆款
今天,iPhone15系列在手机市场引起了热烈的反响。全渠道销售一开启,就受到了广大消费者的热烈追捧。其中,新推出的粉色款iPhone15表现尤为亮眼,成为了京东手机热卖榜上的爆款产品。从预售到首销期间,粉色款iPhone15在京东平台持续热销,占据了4000-6000元手机排行榜的领先位置。此款手机的热销不仅展示了消费者对于苹果新款产品的热爱,也突显了以粉色为代表的女性化手机市场的巨大潜力。站长网2023-09-22 10:08:1400001月6日CES正式亮相!RTX 5090、5080都来了:起步都1.2万元了
快科技12月28日消息,不少玩家期待的RTX50系列将要正式亮相,时间应该锁定在1月6日的CES大会上。从最新曝光的细节看,RTX5090将启用170个流处理器单元(SMs),而其总数为192个,核心数量为21760,较RTX4090的AD102完整核心减少了11.4%。0000