蚂蚁开源ATorch 、 Lookahead两项大模型技术
最近,蚂蚁开源了两项与大模型相关的新技术:ATorch 和 Lookahead。
ATorch 是一个大模型分布式训练加速扩展库,可实现深度学习自动资源动态优化和分布式训练稳定性提升,可提升深度学习的智能性,千亿模型千卡级别训练的算力利用率可达60%。
Lookahead 是一个推理加速框架,可以大幅提升大模型的推理效率,可将推理加速2-6倍。

ATorch 采用了分层架构设计,功能清晰、设计全面,为开发者提供极致精简的开发体验。作为 PyTorch 框架的高性能扩展加速库,ATorch 最少化用户代码侵入,为千亿参数大模型千卡级训练提供易用的高性能方案。在实践中,ATorch 已经在多个开源模型的训练优化实践中表现出色,将算力利用率提升了很多,并且稳定性也得到了显著提升。ATorch 已集成到蚂蚁集团的大模型训练开源产品 DLRover 中,让大模型开发者能够更专注于模型架构的设计,而无需处理工程方面的细节。
Lookahead 是一个推理加速框架,可以将推理加速2-6倍。通过采用多分支策略,Lookahead 能够在一次前向过程中生成更多的 Token,进一步压榨硬件性能。此外,Lookahead 还利用 trie 树存储和检索 Token 序列,并合并多条草稿中相同的父节点,提高计算效率。为了提高易用性,Lookahead 的 trie 树构建不依赖额外的草稿模型,只利用推理过程中的 prompt 及生成的回答进行动态构建,降低了用户的接入成本。
开源地址:https://github.com/intelligent-machine-learning/dlrover/atorch
论文地址:https://arxiv.org/abs/2312.12728
开源地址:https://github.com/alipay/PainlessInferenceAcceleration
新鲜AI产品点击了解:https://top.aibase.com/
广汽推出AI大模型“广汽AI大模型平台” 昊铂GT将搭载
8月8日,广汽正式推出AI大模型技术的最新研发成果——广汽AI大模型平台,将在近期搭载于高端智能轿跑昊铂GT亮相。广汽AI大模型平台聚合了多种AI大模型,并与广汽智能网联底层能力深度融合,不仅能调用通用大模型的能力,还能基于智能汽车的应用场景构建专用模型,实现全场景智能体验的跃迁。站长网2023-08-08 14:39:360000《魔兽世界》今日起接入战网功能: 6 月 6 日将公布最新消息
站长之家(ChinaZ.com)6月3日消息:《魔兽世界》官方近日宣布,为了给玩家带来更加流畅与便捷的游戏体验,将于6月3日至5日对官网进行维护,并在此期间接入战网功能。维护期间,玩家可能暂时无法登录官网或进行留言等操作,敬请谅解。站长网2024-06-03 12:44:130000微软推出用于 Azure AI Health Insights 的新 AI 模型
站长之家(ChinaZ.com)10月12日消息:微软通过AzureHealthInsights发布了一系列专为医疗保健行业定制的数据和人工智能产品。这些工具旨在帮助医疗机构利用其产生的大量数据,从而改善患者护理并简化运营。利用MicrosoftFabric改善医疗保健站长网2023-10-12 15:43:490000配置大升级、成本大增!卢伟冰:小米14 Ultra肯定要涨价
快科技2月21日消息,小米14Ultra将于2月22日发布,这是小米年度影像旗舰,在配置上堆了很多料。此前有数码博主透露,小米14Ultra因堆料太猛,将要涨价,今日,小米集团总裁卢伟冰确认了这一说法。有网友在卢伟冰微博评论区询问,卢总这次价格这么说”,卢伟冰回复道:配置大升级,体验大升级,成本大增加,肯定要涨价”。站长网2024-02-21 21:35:490000懂3D的语言模型来了!UCLA、上交、MIT等联合提出3D-LLM:性能大涨9%
【新智元导读】有了3D-语言模型,去重庆导航也不在「话」下!大型语言模型(LLM)和视觉语言模型(VLM)在各种评测基准中都展现出了强大的性能,比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界,也就无法理解更丰富的现实概念,包括空间关系、布局、物体反馈等。站长网2023-08-03 15:53:000000