清华发布SmartMoE:支持用户一键实现 MoE 模型分布式训练
清华大学计算机系 PACMAN 实验室发布了一种稀疏大模型训练系统 SmartMoE,该系统支持用户一键实现 Mixture-of-Experts(MoE)模型的分布式训练,并通过自动搜索并行策略来提高训练性能。

论文地址:https://www.usenix.org/system/files/atc23-zhai.pdf
项目地址:https://github.com/zms1999/SmartMoE
MoE 是一种模型稀疏化技术,通过将小模型转化为多个稀疏激活的小模型来扩展模型参数量。然而,传统的专家并行技术在训练 MoE 模型时存在性能问题,因为稀疏激活模式导致节点间不规则的 all-to-all 通信增加延迟和计算负载不均。

为了解决这些问题,SmartMoE 系统设计了专家放置策略和自动并行算法。通过对常用并行策略的支持和动态负载均衡,SmartMoE 系统在性能测试中表现出较高的加速比。
该系统的特点包括:
支持常用并行策略:SmartMoE 系统对数据并行、流水线并行、模型并行和专家并行等四种并行策略进行了全面的支持,并允许用户任意组合这些策略。
专家放置策略:为了处理 MoE 模型的动态计算负载,SmartMoE 系统设计了专家放置策略,根据当前负载调整专家的放置顺序,实现节点间的负载均衡。
两阶段自动并行算法:为了提高 MoE 模型复杂混合并行策略的易用性,SmartMoE 系统设计了一套轻量级且有效的两阶段自动并行算法。这个算法将自动并行搜索过程分为训练开始前的搜索和训练过程中的动态调整两个阶段,以减少搜索的开销。
高性能:在性能测试中,SmartMoE 在不同模型结构、集群环境和规模下都表现出优异的性能。相较于之前的 FasterMoE 系统,SmartMoE 能够实现高达1.88倍的加速比。
总之,SmartMoE 是一种可以一键实现高性能 MoE 稀疏大模型分布式训练的系统,具有支持多种并行策略、专家放置策略和两阶段自动并行算法的特点。通过这些特点,SmartMoE 系统能够提高 MoE 模型的易用性和训练性能,助力 MoE 大模型的发展。
固态电池呼之欲出!丰田汽车:材料技术取得突破 接近量产水平
快科技10月23日消息,近日,丰田汽车表示:已经在电池材料技术上取得了突破,能在2027年或2028年之前大规模生产固态电池。据悉,丰田当前研发的固态电池的充电速度将会是特斯拉充电速度的1.5倍,充电10分钟可行驶1200公里,已经接近了燃油车加油所需要的时间。从此前透露的消息来看,固态电池具有充电速度快、安全性高、续航里程长的特点,被视为下一代电池技术。0000微信好友达上限后能看到删除你的人 腾讯客服:灰度测试中
近日,微信用户发现了一个新功能:当微信好友数量达到上限时,系统会自动提示用户查找并删除那些已经将自己删除的好友。腾讯客服对此进行了解释,称这一提醒功能的出现是因为用户的通讯录联系人数量已经达到了上限。为了避免用户在添加新好友时因超过添加次数限制而无法成功,系统会根据一定的逻辑展示部分通讯录好友,用户可以选择删除一些联系人,以便继续添加新的好友。0000MidReal AI更新Beta版本 官网上线推荐小说页面
AI小说生成工具MidRealAI最新更新了Beta版本,不仅更新了模型,还增加了许多新功能。新模型生成的内容更有逻辑,更连贯。同时,官网上线了小说展厅,用户可以在官网上查看推荐的小说,比在Discord上阅读更加舒适。此外,还增加了新功能,比如使用“/start_private”命令可以创建完全私密的内容,让用户不用担心发布的提示词导致自己社交媒体上的尴尬。站长网2024-01-03 09:49:510000AI在线视频剪辑工具Opus Clip 长视频一键变高质量短视频
OpusClip是一款生成式人工智能视频工具,可以将长视频一键转换成高质量短视频,让您可以在TikTok、YouTubeShorts和Reels等平台上分享,以增加社交媒体的影响力。体验地址:https://www.opus.pro/not-available核心功能:站长网2023-08-21 16:18:420008研究表明,AI图像生成器正在接受儿童露骨照片进行训练
划重点:-🚩报告指出,人工智能图像生成器的基础中隐藏着数千张儿童淫秽照片。-🚩这些图片使得AI系统更容易生成逼真的虚假儿童图片,并将社交媒体上全副武装的真实青少年照片转化为裸体照片。-🚩这个问题没有简单的解决办法,需要公司采取行动来解决技术中的漏洞。根据一份新报告,人工智能图像生成器的基础中隐藏着数千张儿童淫秽照片,该报告敦促公司采取行动解决技术中的缺陷。0001