英伟达推出更强大的升级款人工智能芯片 GH200:内存是 H100 的三倍
英伟达于周二发布了一款设计用于运行人工智能模型的新芯片,以抵挡包括 AMD、谷歌和亚马逊在内的竞争对手在 AI 硬件领域的挑战。

根据一些估算,目前英伟达在 AI 芯片市场占有超过 80% 的份额。该公司专攻图形处理单元(GPU),已成为支撑生成式 AI 软件(如谷歌的 Bard 和 OpenAI 的 ChatGPT)的较大型 AI 模型的首选芯片。然而,由于科技巨头、云服务提供商和初创公司争夺 GPU 能力来开发自己的 AI 模型,英伟达的芯片供应短缺。
英伟达的新芯片 GH200 与公司目前最高端的 AI 芯片 H100 采用相同的 GPU。但是,GH200 将该 GPU 与 141GB 的尖端内存以及 72 核的 ARM 中央处理器配对。
英伟达 CEO 黄仁勋在周二的一次演讲中表示:「我们给这个处理器做了增强。」他还补充道:「这个处理器专为全球数据中心的规模而设计。」
据黄仁勋称,这款新芯片将于明年第二季度在英伟达的经销商处面市,并将在年底前供样品测试。英伟达代表拒绝透露价格。
通常,使用 AI 模型的过程分为训练和推理至少两个部分。
首先,使用大量数据对模型进行训练,这个过程可能需要数月时间,有时需要像英伟达的 H100 和 A100 芯片那样的成千上万个 GPU。然后,将模型用于软件中进行预测或生成内容,这个过程称为推理。与训练一样,推理需要大量的计算资源开销,并且每次软件运行时都需要大量的处理能力,比如生成文本或图像时。但与训练不同的是,推理几乎是持续进行的,而训练只有在需要更新模型时才需要进行。
黄仁勋表示:「你可以选择几乎任何大型语言模型放入其中,它将以令人惊讶的速度进行推理。大型语言模型的推理成本将大幅降低。」
英伟达的新 GH200 芯片专为推理而设计,因为它拥有更大的存储容量,可以将更大的 AI 模型放置在一个单独的系统上,英伟达副总裁 Ian Buck 在周二与分析师和记者的电话会议上表示。英伟达的 H100 内存容量为 80GB,而新的 GH200 为 141GB。英伟达还宣布推出了一个将两个 GH200 芯片结合成一台计算机的系统,以运行更大的模型。
Buck 说:「更大的存储容量使得模型可以常驻在单个 GPU 上,无需多个系统或多个 GPU 来运行。」
此次宣布正值英伟达的主要 GPU 竞争对手 AMD 最近发布了自己的 AI 芯片 MI300X,该芯片支持 192GB 的内存,被市场推广为适用于 AI 推理。包括谷歌和亚马逊在内的公司也正在设计自己的定制 AI 芯片用于推理。
微软两款自研 AI 芯片 Maia 100 和 CobAlt 将由台积电代工:采用 5 纳米制程技术
据DIGITIMES消息,在本周三的Ignite开发者大会上,微软发布了两款自主研发的人工智能(AI)芯片:Maia100和CobAlt。这两款芯片由台积电代工,采用5纳米制程技术,预计将于明年投入微软Azure数据中心,提升包括OpenAI、Copilot等服务的能效。站长网2023-11-17 16:03:410000Meta 新模型:如果我每14秒生成一个高清视频,好莱坞的各位要如何应对|「变压器」
利用人工智能来合成视频一直是该领域的难题,因为其中最关键的一环——映射与合成,缺乏优秀的模型算法,只能利用卷积神经网络(CNN)和生成对抗网络(GAN)来不断提取特征、生成、判断,直至最后结果。比如此前曾大火的Deepfake技术,俗称人工智能换脸,生成一个短短几秒的“换头”视频也需要10分钟左右的时间。0002谷歌广告推出新的人工智能助手 处在测试阶段
谷歌广告帮助指南有了一个新的AI助手。目前,这个新工具处于公开测试阶段,旨在帮助用户找到答案并解决与谷歌广告相关的账户问题。目前,部分用户被邀请测试这个AI并提供反馈。下面是这个新工具的截图,由PPC专家JulieFBacchini分享:有趣的是,这个新的AI助手明显带有一个免责声明,警告:站长网2023-08-15 10:55:220000淘宝618推出左撇子会场 满足小众用户需求
6月12日消息,淘宝618正式为左撇子小众群体设立专门会场,用户只需搜索“左撇子商品有哪些”,便可轻易地找到专属商品,如左手使用的文具、餐具、剪刀、吉他、笛子、腕表、开瓶器、鼠标、键盘、自行车和扑克牌等。站长网2023-06-12 17:53:220001