蚂蚁开源ATorch 、 Lookahead两项大模型技术
最近,蚂蚁开源了两项与大模型相关的新技术:ATorch 和 Lookahead。
ATorch 是一个大模型分布式训练加速扩展库,可实现深度学习自动资源动态优化和分布式训练稳定性提升,可提升深度学习的智能性,千亿模型千卡级别训练的算力利用率可达60%。
Lookahead 是一个推理加速框架,可以大幅提升大模型的推理效率,可将推理加速2-6倍。
ATorch 采用了分层架构设计,功能清晰、设计全面,为开发者提供极致精简的开发体验。作为 PyTorch 框架的高性能扩展加速库,ATorch 最少化用户代码侵入,为千亿参数大模型千卡级训练提供易用的高性能方案。在实践中,ATorch 已经在多个开源模型的训练优化实践中表现出色,将算力利用率提升了很多,并且稳定性也得到了显著提升。ATorch 已集成到蚂蚁集团的大模型训练开源产品 DLRover 中,让大模型开发者能够更专注于模型架构的设计,而无需处理工程方面的细节。
Lookahead 是一个推理加速框架,可以将推理加速2-6倍。通过采用多分支策略,Lookahead 能够在一次前向过程中生成更多的 Token,进一步压榨硬件性能。此外,Lookahead 还利用 trie 树存储和检索 Token 序列,并合并多条草稿中相同的父节点,提高计算效率。为了提高易用性,Lookahead 的 trie 树构建不依赖额外的草稿模型,只利用推理过程中的 prompt 及生成的回答进行动态构建,降低了用户的接入成本。
开源地址:https://github.com/intelligent-machine-learning/dlrover/atorch
论文地址:https://arxiv.org/abs/2312.12728
开源地址:https://github.com/alipay/PainlessInferenceAcceleration
新鲜AI产品点击了解:https://top.aibase.com/
「ChatGPT最强竞品」爆火,不限量不要钱免注册,一手实测体验在此
家人们,终于!终于!免费、支持中文、无需注册、不用骚操作直接可用的类ChatGPT产品,它来了!(此等好事必须第一时间和家人们分享)毫不意外的,目前它的热度已经被炒到不行:而且已经有一波网友抢先体验了一番,铺天盖地的一致好评。例如微博博主“Simon_阿文”就给出了这样的评价:是我目前为止试过最舒服的中文聊天体验。没错,它,就是“ChatGPT最强竞品”,Claude。站长网2023-04-14 14:07:230000字节跳动与中科大联手提出多模态文档大模型DocPedia
要点:字节跳动与中国科学技术大学联合研究的多模态文档大模型DocPedia成功突破分辨率极限,达到2560×2560,相较于现有先进模型有显著提升。DocPedia不仅能准确识别图像信息,还能结合用户需求调用知识库回答问题,展现了高分辨率多模态文档理解的强大能力。训练DocPedia的关键在于采用感知-理解联合训练策略,通过频域处理解决分辨率问题,以及在微调阶段进行整体优化,显著提高了性能。站长网2023-12-04 14:45:440001OpenAI 宣布推出 ChatGPT 漏洞赏金计划 但不接受越狱行为
风靡一时的聊天机器人ChatGPT背后的公司OpenAI周二宣布,它将向报告其人工智能系统漏洞的用户提供最多20000美元资金。OpenAI表示:「我们的奖励范围从200美元的低严重性发现到高达20000美元的特殊发现,」。该计划是通过Bugcrowd这个漏洞赏金平台进行的。站长网2023-04-12 14:40:100000消息称苹果正研发AI大语言模型“Apple GPT”
根据彭博社的马克・古尔曼的消息,苹果公司正在开发一个名为“AppleGPT”的人工智能项目,这个项目类似于OpenAI的ChatGPT项目。然而,苹果并没有立即发布这个项目的计划,可能会在2024年发布。站长网2023-07-20 12:59:300000谦寻控股回应急聘近万名“数字人”:纯属造谣
站长之家(ChinaZ.com)2月18日消息:近日m一则招聘启事显示,谦寻控股计划大规模招聘9000多名“数字人”,用于为品牌做直播产品推介。据了解,“数字人”系通过AI生成的数字化人物形象,需要人工进行配音。谦寻控股对此事作出回应,称网传的大规模招聘“数字人”的消息和招聘海报均系第三方公司捏造和散布,不属实。0000