腾讯披露最新大模型训练方法:Angel框架升级 效率提升2.6倍
要点:
腾讯披露混元大模型训练方法,Angel框架升级,大模型训练效率提升至2.6倍,千亿级大模型训练可节省50%算力成本。
AngelPTM机器学习训练框架通过多维度并行优化存储,在通讯方面采用软硬件结合解决方案,提高大模型训练稳定性。
腾讯推出大模型推理框架AngelHCF,通过扩展并行能力和关键能力优化,相较于主流框架,推理速度提高了1.3倍。
在当前大模型参数规模呈指数级增长的情况下,腾讯近日披露了混元大模型训练的最新方法,通过升级自研机器学习框架Angel,成功提升大模型训练效率。这一升级使得千亿级大模型训练可以节省高达50%的算力成本,为应对算力紧缺提供了有力支持。Angel框架的升级不仅仅在于提高效率,还支持单任务万卡级别超大规模训练,进一步提升了腾讯云HCC大模型专属算力集群的性能和效率。
图源备注:图片由AI生成,图片授权服务商Midjourney
为了进一步提高大模型的训练和推理效率,腾讯自研了机器学习训练框架AngelPTM。在存储方面,AngelPTM采用多维度的并行计算,包括数据并行、模型并行、流水并行和序列并行。
此外,通过在ZeRO-Cache的基础上引入统一视角技术,将显存和主存打通,有效扩展了显存容量,提升了单机存储容量达90%。在通讯方面,腾讯通过软硬件结合的方式解决,构建了3.2T RDMA网络来拓宽带宽,同时在框架软件层面做GPU拓扑感知,实现了负载均衡的流水并行。为了确保稳定性,腾讯对基础设施的网络、硬件、存储、云原生调度都进行了监控,并实施了自动续训和系统容错。
此外,为解决推理成本不断上升的问题,腾讯推出了大模型推理框架AngelHCF。通过扩展并行能力和关键能力的优化,包括Embedding共享、Attention算子优化、Paged Attention优化等方式,提高了推理性能,相较于主流框架,AngelHCF的推理速度提高了1.3倍。这一框架在腾讯混元大模型文生图的应用中,将推理耗时从原本的10秒缩短至3至4秒。
腾讯不仅仅在大模型训练方面取得了显著的效率提升,还在推理阶段取得了实质性的优化。这一系列技术提升已经在腾讯云上得以开放,为用户提供更优的训练和推理加速能力,同时支持客户一站式训练精调,打造专属智能应用。腾讯内部已有超过300项业务和应用场景接入腾讯混元大模型内测,涵盖了文本总结、摘要、创作、翻译、代码等多个领域,这标志着整个生产链路的全面升级,从模型研发到应用落地形成了一站式的平台,进一步推动了大模型应用的发展。
360新品发布会“被盗图人”喊话周鸿祎:要求公开道歉 赔偿1元RMB
快科技6月13日消息,360AI新品发布会被盗图人”DynamicWangs发微博喊话周鸿祎,要求公开道歉,赔偿1元RMB。DynamicWangs发微博称:周鸿祎先生,贵司在6月6日的AI发布会上,未经授权使用我的模型生成的图片进行重绘、二度创作,并在公开场合发表使用,严重影响和侵犯了我的权益。我在这里郑重的要求您对于上述侵权行为进行公开道歉,并进行赔偿,赔偿金额1元RMB。”站长网2024-06-14 00:28:450000马斯克:SpaceX和星链都没用AI AI在这些方面表现糟糕
在洛杉矶近日举行的米尔肯研究所全球会议上,美国知名企业家埃隆·马斯克再次就人工智能(AI)的议题发表了自己的看法。马斯克明确表示,他的太空探索技术公司(SpaceX)在运营中“基本不使用人工智能”。站长网2024-05-08 19:52:020000盘点欧洲 21 家值得关注的生成式人工智能初创公司
根据Dealroom的数据,今年迄今为止,生成式AI初创公司的收入已达到创纪录的6.2亿美元。比如成立4周的法国初创公司Mistral在6月份筹集了1.05亿欧元,尽管还没有任何产品。英国的Synthesia也在6月份筹集了9000万美元,德国的DeepL在1月份筹集了1亿欧元。站长网2023-08-16 14:37:400003智源研究院推出新一代多模态小模型Bunny-3B
智源研究院近期提出了一项新技术,通过数据浓缩技术获得高质量训练数据,从而提升多模态小模型的性能。具体来说,他们将LAION-2B压缩成2M核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。这一技术路线带来了新一代多模态小模型Bunny系列,其中Bunny-3B表现出色,在多个基准上超越了其他近期热门模型,与大模型相媲美。站长网2024-02-23 09:55:220004一张照片定制AI拜年视频,悄悄惊艳所有亲戚(附教程)
有了AI,现在这春节过得越来越“科幻”了。前两天我们刚送出用AI绘画制作的微信红包封面,现在又流行起了AI拜年视频——小红书@蜡笔年糕小红书@爱宠大酱抖音@老麦的工具库是不是看起来有点眼熟?没错,一个月前火爆全网的“科目三”AI视频也是这样生成的:在阿里云通义千问APP中选择“全民舞王”应用,上传一张照片就能生成舞蹈视频,只不过这次动作换成了拜年姿势,套上了新春模板。站长网2024-02-07 16:06:400002