清华发布SmartMoE:支持用户一键实现 MoE 模型分布式训练
清华大学计算机系 PACMAN 实验室发布了一种稀疏大模型训练系统 SmartMoE,该系统支持用户一键实现 Mixture-of-Experts(MoE)模型的分布式训练,并通过自动搜索并行策略来提高训练性能。
论文地址:https://www.usenix.org/system/files/atc23-zhai.pdf
项目地址:https://github.com/zms1999/SmartMoE
MoE 是一种模型稀疏化技术,通过将小模型转化为多个稀疏激活的小模型来扩展模型参数量。然而,传统的专家并行技术在训练 MoE 模型时存在性能问题,因为稀疏激活模式导致节点间不规则的 all-to-all 通信增加延迟和计算负载不均。
为了解决这些问题,SmartMoE 系统设计了专家放置策略和自动并行算法。通过对常用并行策略的支持和动态负载均衡,SmartMoE 系统在性能测试中表现出较高的加速比。
该系统的特点包括:
支持常用并行策略:SmartMoE 系统对数据并行、流水线并行、模型并行和专家并行等四种并行策略进行了全面的支持,并允许用户任意组合这些策略。
专家放置策略:为了处理 MoE 模型的动态计算负载,SmartMoE 系统设计了专家放置策略,根据当前负载调整专家的放置顺序,实现节点间的负载均衡。
两阶段自动并行算法:为了提高 MoE 模型复杂混合并行策略的易用性,SmartMoE 系统设计了一套轻量级且有效的两阶段自动并行算法。这个算法将自动并行搜索过程分为训练开始前的搜索和训练过程中的动态调整两个阶段,以减少搜索的开销。
高性能:在性能测试中,SmartMoE 在不同模型结构、集群环境和规模下都表现出优异的性能。相较于之前的 FasterMoE 系统,SmartMoE 能够实现高达1.88倍的加速比。
总之,SmartMoE 是一种可以一键实现高性能 MoE 稀疏大模型分布式训练的系统,具有支持多种并行策略、专家放置策略和两阶段自动并行算法的特点。通过这些特点,SmartMoE 系统能够提高 MoE 模型的易用性和训练性能,助力 MoE 大模型的发展。
基于ChatGPT的低代码开发框架PromptAppGPT上线 全自动编译
最近,CCF理论计算机科学技术委员会委员张长旺开发了一款创新的自然语言开发框架PromptAppGPT,它是基于ChatGPT的首个自然语言开发框架。据悉,PromptAppGPT支持低代码提示语(即Prompt)应用开发、GPT文本生成、DALL-E图像生成、在线代码编辑器编译器运行器、自动用户界面生成、插件扩展等功能。站长网2023-06-08 16:58:270000Meta悄然发布Llama 2 Long AI模型
要点:1.Meta发布了Llama2LongAI模型,通过改进训练和编码方法,在某些任务上超越了GPT-3.5Turbo和Claude2。2.该模型使用RoPE编码和强化学习改进,提高了在编码、数学、语言理解等任务中的性能。3.文章还讨论了AI驱动的恶意机器人对网络安全的威胁,强调了数据防御策略和合作的重要性。站长网2023-10-02 10:43:460000APISR:超强动漫图片高清放大器 动漫爱好者的福音!
APISR是一款强大的工具,专门设计用于提升动漫图像和视频的分辨率。它不仅可以处理各种图像退化问题,如模糊、噪声、压缩伪影等,还提供了灵活的放大选项,支持2倍、4倍等不同的放大系数。试玩地址:https://top.aibase.com/tool/apisr项目地址:https://github.com/Kiteretsu77/APISR站长网2024-03-20 15:23:120003又有抖音网红因此丧命!这个内容分类1年内多人殒命
直播短视频的出现,让很多人有了新的方式记录生活。网友们各种各样的兴趣爱好,也通过平台内容的推送进一步扩散。就拿摩托车来说,这个在中国很多城市都有禁行条款的交通工具,在抖音里与摩托车相关的话题视频,播放量高达951亿次。然而,当摩托车与流量挂上钩,摩托车就不再是简单的交通工具,而是众多主播达人吸粉、树立人数的符号。站长网2023-09-18 22:06:410000IDC:预计到2026年50%终端将搭载硬件AI引擎功能
国际数据公司IDC公布预测称,到2026年,中国市场中近50%的终端设备的处理器将带有AI引擎技术。IDC认为,未来AI终端将在以下十大领域广泛落地发展:创作与创意未来,人工智能可用于生成创意作品,如艺术、音乐、文学作品等。它可以帮助艺术家和创作者产生新的创意和设计,为个人PC、平板用户带来有趣的体验。游戏和虚拟世界站长网2023-07-25 17:18:210000