微软推ZeRO++新系统:减少大模型训练时间和成本
微软研究人员推出了名为ZeRO 的新系统,用于优化训练大型AI模型,以应对高数据传输开销和有限带宽的难题。
ZeRO 建立在现有的 ZeRO 优化的基础上,并提供增强的通信策略,以提高训练效率,减少训练时间和成本。
像Turing-NLG、ChatGPT和GPT-4这样的大型模型的训练需要跨多个GPU设备占用大量内存和计算资源。DeepSpeed开发的ZeRO 引入了通信优化策略,以克服在每个GPU上批量大小较小时或在低带宽集群上进行训练时ZeRO的限制。
ZeRO优化系列包括ZeRO-Inference,它使用GPU的集体内存和计算能力,将模型状态分割在多个GPU之间。然而,在训练过程中,ZeRO可能会产生较高的通信开销。ZeRO 通过整合三组通信优化来解决这个问题:量化权重通信(qwZ)、分层权重分割(hpZ)和量化梯度通信(qgZ)。
为了减少参数通信量,ZeRO 对权重进行量化,利用基于块的量化方法来保持训练精度。这种优化的量化过程比基本量化更快更准确。为了在反向传播过程中尽量减少通信开销,ZeRO 通过在每台机器上保持完整的模型副本,以 GPU 内存换取通信。梯度通信方面,ZeRO 引入了一种新的量化梯度通信范式 qgZ,可以减少跨节点的流量和延迟。
这些通信优化大大减少了通信量。与ZeRO相比,ZeRO 实现了减少高达4倍的通信量,提高了训练吞吐量和效率。当在每个GPU上使用小批量大小时,在高带宽集群中,ZeRO 相比ZeRO-3的吞吐量提高了28%至36%。在低带宽集群中,与ZeRO-3相比,ZeRO 实现了平均2倍的加速,使得大模型训练在更多种类的集群上更为可行。
ZeRO 不仅限于训练场景,还可应用于对话模型中使用的人类反馈强化学习(RLHF)训练。通过将ZeRO 与DeepSpeed-Chat集成,RLHF训练可以获得更好的生成和训练吞吐量,生成吞吐量提高了高达2.25倍,训练吞吐量提高了1.26倍,超过了ZeRO。
DeepSpeed已经发布了ZeRO ,以使大型模型的训练在AI社区更加高效和可访问。该系统旨在加快训练速度,减少通信开销,并实现更大的批量大小,从而节省时间和资源。研究人员和实践者可以利用ZeRO 更有效地训练像ChatGPT这样的模型,并在AI领域探索新的可能性。
程一笑眼里的信任电商,离不开3个支撑点
过去三年,快手电商收获了GMV和买家数量的数倍增长。2022全年,快手电商GMV同比增长32.5%达到9012亿元,月活跃买家稳定在1亿以上。快手电商生态也发生了翻天覆地的变化,从历届引力大会我们就能看到清晰的答案。2021年,在首届快手电商引力大会上,快手向外界展示了快手电商独有的“内容私域”生态的潜力和爆发力。站长网2023-05-15 16:35:450000余承东把问界M9送到360楼下 周鸿祎:非常感动 永远支持华为
近日,360创始人周鸿祎公开表示有意出售自己的迈巴赫600,计划换购国产新能源汽车。此消息一出,立即引起了众多国内新能源车厂商的关注。蔚来、小鹏、极氪、理想等知名品牌纷纷将自家主流车型送至360公司总部,供周鸿祎亲自体验。这一景象也吸引了众多网友前来直播打卡,使得360公司楼下俨然成为了一个小型车展,被网友们戏称为“798小车展”。站长网2024-04-26 10:24:370001Nvidia计划在日本建立半导体工厂网络以满足AI需求
**划重点:**1.Nvidia首席执行官JensenHuang宣布在日本建立一系列半导体工厂,以满足对人工智能图形芯片不断增长的需求。2.该计划是与日本公司的重要合作,旨在支持先进人工智能应用的图形芯片需求。3.Nvidia承诺支持日本培养本国人工智能技术,与日本政府的半导体基础设施复兴计划相契合。站长网2023-12-05 11:07:260000谷歌推出新的 AI 控制机器人 RT-2 模型:将文本和图像转化为机器人动作
站长之家(ChinaZ.com)7月31日消息:忘记了那些能画画的人工智能,谷歌最新的人工智能模型能够控制机器人。上周五,谷歌推出了RoboticsTransformer2(RT2),这是一个视觉-语言-动作(VLA)模型,可以将文本和图像输出为机器人动作。谷歌表示,RT-2「让我们更接近机器人的未来。」站长网2023-07-31 09:21:080000《黑神话》火出国外,民族品牌值得重估?
8月20日,孙悟空重回宇宙C位。游戏科学用一部《黑神话:悟空》刷屏了几乎所有的社交媒体。第一个国产3A游戏、steam平台历史同时在线人数第二、全平台销量超1000万套,每一个标签都极具风向标意义。腾讯高级副总裁马晓轶在朋友圈说:“终于等来这一天,属于天命人的一天,整个花果山的希望。”站长网2024-09-01 14:08:160001