科学家创新技术用更少的GPU训练ChatGPT级别万亿参数模型
**划重点:**
1. 🌐 科学家使用世界最强大的超级计算机的仅8%算力,成功训练出ChatGPT规模的模型。
2. 🚀 Oak Ridge National Laboratory的研究团队在Frontier超级计算机上使用创新技术,仅用数千个AMD GPU训练了一个拥有万亿参数的语言模型。
3. 💡 通过分布式训练策略和各种并行技术,研究团队实现了在仅占用Frontier计算能力8%的情况下,训练1750亿参数和1万亿参数模型的百分之百弱扩展效率。
科学家们在世界上最强大的超级计算机上取得了巨大突破,仅使用其8%的计算能力,成功训练了一个与ChatGPT规模相当的模型。这项研究来自著名的Oak Ridge National Laboratory,他们在Frontier超级计算机上采用了创新技术,仅使用数千个AMD GPU就训练出了一个拥有万亿参数的语言模型。
通常,训练像OpenAI的ChatGPT这样规模的语言模型需要一个庞大的超级计算机。然而,Frontier团队采用了分布式训练策略,通过优化并行架构,仅使用Frontier计算能力的8%就成功完成了这一任务。具体而言,他们采用了随机数据并行和张量并行等技术,以降低节点之间的通信,同时处理内存限制。
这项研究的结果显示,在1750亿参数和1万亿参数模型的情况下,弱扩展效率达到了100%。此外,这个项目还取得了这两个模型的强扩展效率分别为89%和87%。
然而,训练拥有万亿参数的大型语言模型始终是一个具有挑战性的任务。研究人员指出,这个模型的体积至少为14TB,而Frontier中的一块MI250X GPU只有64GB。他们强调,需要进一步研究和开发方法来克服内存问题。
在面临大批次大小导致的损失发散问题时,研究人员提出,未来关于大规模系统训练时间的研究必须改善大批次训练,并采用更小的每副本批次大小。此外,研究人员呼吁在AMD GPU上进行更多工作,指出目前大多数大规模模型训练都是在支持Nvidia解决方案的平台上进行的。尽管研究人员为在非Nvidia平台上高效训练大型语言模型提供了“蓝图”,但他们认为有必要更深入地研究在AMD GPU上的高效训练性能。
Frontier在最近的Top500榜单中保持其作为最强大超级计算机的地位,超过了Intel推出的Aurora超级计算机。这项研究为未来训练巨大语言模型提供了宝贵的经验和方法,同时也突显了分布式训练和并行计算在实现这一目标上的关键作用。
3799元 网友入手真我GT5 1TB顶配版:连网盘钱都省了
快科技9月6日消息,一位网友入手了真我GT524GB1TB顶配版,官方售价是3799元。他说,开了20多个APP,再回到第一个都没遇到杀后台的情况,比我上一台12GB手机强太多,以后也不用担心杀后台了;1TB的存储按照我的使用速度,估计也够我钉好几年了,连开网盘存照片的钱都省了。站长网2023-09-06 21:36:250000微信已把帐号改为账号 此前QQ、抖音等已经更正
据每日经济新闻报道,目前,在安卓系统手机登录微信时,微信相关页面和表述中的“帐号”已经改为“账号”。据悉,去年4月有媒体报道披露,多个社交软件和平台的用户登录页面、用户协议、隐私政策等相关表述中多处使用的是“帐号”。多位专家接受采访时表示,“帐号”为旧时用法,现在正确的表述是“账号”。站长网2023-07-28 10:44:030001走向精品化,大厂游戏疯狂卷“质量”
字节跳动又对游戏“动刀”了。5月31日,字节跳动宣布游戏业务迎来调整,前完美世界游戏业务总裁张云帆将担任游戏业务,字节跳动还在内部邮件中总结了游戏业务的下一阶段的目标,即游戏业务进入第二阶段,要更有耐心地做好产品研发和运营,为用户做好玩的游戏。站长网2024-06-06 00:03:200000余承东终端业务职位变动:仍是的一把手!
快科技5月1日消息,根据最新公布的业绩报告,华为2024年一季度收入约1784.5亿元,同比增长36.66%,归母净利润约196.5亿元,同比增长约564%,净利润率11%。与此同时,有媒体报道称,余承东将卸任华为终端BGCEO一职,同时继续担任终端BG董事长,而原华为终端BG首席运营官何刚接替余承东担任终端BGCEO。0000OpenAI CEO 在美国国会首秀:回应对 AI 的一切质疑,主动要求接受监管!
从最初只有十来个人的小团队,到如今的300人;从起步拿到10亿美元启动资金,到创造了估值约为300亿美元的AI独角兽“神话”,OpenAI用GPT系列、Whisper、DALL-E2不仅打开了AIGC的新大门,也让自己在AI领域站稳了脚步。然而,正所谓树大招风,因为在AI法律法规、规范标准还不完善的情况下,技术先行引发了很多部门以及竞争者的关注。站长网2023-05-18 09:36:140002