昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE 性能强劲成本更低
在大模型技术迅速发展的背景下,昆仑万维公司开源了一个具有里程碑意义的稀疏大型语言模型Skywork-MoE。这个模型不仅在性能上表现出色,而且还大幅降低了推理成本,为应对大规模密集型LLM带来的挑战提供了有效的解决方案。
Skywork-MoE模型特点:
开源和免费商用:Skywork-MoE的模型权重、技术报告完全开源,且免费商用,无需申请。
推理成本降低:该模型在保持性能强劲的同时,大幅降低了推理成本。
稀疏模型:Skywork-MoE是一个专家混合模型(MoE),通过将计算分配给专门的子模型或“专家”,提供了一种经济上更可行的替代方案。
支持单台4090服务器推理:是首个支持用单台4090服务器推理的开源千亿MoE大模型。
技术细节:
模型权重和开源仓库:模型权重可在Hugging Face上下载,开源仓库位于GitHub。
推理代码:提供了支持8x4090服务器上8bit量化加载推理的代码。
性能:在8x4090服务器上,使用昆仑万维团队首创的非均匀Tensor Parallel并行推理方式,Skywork-MoE可以达到2200tokens/s的吞吐量。
模型性能和技术创新:
参数量:Skywork-MoE的总参数量为146B,激活参数量22B,共有16个Expert,每个Expert大小为13B。
性能对比:在相同的激活参数量下,Skywork-MoE的能力在行业前列,接近70B的Dense模型,推理成本有近3倍的下降。
训练优化算法:Skywork-MoE设计了两种训练优化算法,包括Gating Logits归一化操作和自适应的Aux Loss,以解决MoE模型训练困难和泛化性能差的问题。
大规模分布式训练:
Expert Data Parallel:提出了一种新的并行设计方案,可以在Expert数量较小时高效地切分模型。
非均匀切分流水并行:提出了非均匀的流水并行切分和重计算Layer分配方式,使得计算/显存负载更均衡。
实验和经验规则:
Scaling Law实验:探究了影响Upcycling和From Scratch训练MoE模型好坏的约束。
训练经验规则:如果训练MoE模型的FLOPs是训练Dense模型的2倍以上,则选择From Scratch训练MoE更好;否则,选择Upcycling训练MoE可以减少训练成本。
Skywork-MoE的开源为大模型社区带来了一个强大的新工具,有助于推动人工智能领域的发展,特别是在需要处理大规模数据和计算资源受限的场景中。
项目页:https://top.aibase.com/tool/skywork-moe
模型下载地址:https://huggingface.co/Skywork/Skywork-MoE-Base
三星Galaxy S24系列中国新品发布会今晚举行 国行价格即将公布
今晚(1月25日)19:00,三星将在中国举行GalaxyS24系列新品发布会,正式公布新机的国行价格。此前,三星已在海外发布了GalaxyS24系列手机,而国行的先行者价格也已经公布。GalaxyS24系列包括GalaxyS24、GalaxyS24和GalaxyS24Ultra三款机型。站长网2024-01-25 17:14:180000进入下半场,MCN如何在小红书找到更多确定性
MCN行业的发展正在进入下半场。MCN机构及创作者普遍开始面对内容创作同质化,创作生命周期相对短暂的挑战,急需找到更有效的路径来创新内容,延续创作者的生命周期。同时,越来越多的MCN机构开始感受到业务增长的压力。《2024克劳锐中国内容机构(MCN)行业发展研究白皮书》显示,41%的MCN机构认为寻找新的增长业务变得更难。站长网2024-09-29 12:15:050000分析数百个涨粉新星,我找到了小红书内容赛道的3个趋势
2023拉下帷幕,昨天,知名商业智能数据服务商QuestMobile发布了《2023中国移动互联网年度报告》。报告显示,在经历了十多年的持续增长之后,中国移动互联网使用粘性2023年出现了轻微下滑。2023年12月,移动互联网月人均时长为165.9小时,同比下降了近12小时、约7%;月人均使用次数为2559.6次,同比微降了近3%;月人均使用APP个数则同比继续微涨。站长网2024-02-01 09:08:050000完全自动驾驶发布在即!曝特斯拉正向相关部门备案FSD功能
快科技5月31日消息,据多家媒体报道,特斯拉中国正在准备向相关部门备案其全自动驾驶(FSD)软件,计划今年向用户推送FSD功能,并考虑推出每月710元人民币的订阅服务。目前,该消息尚未得到特斯拉官方的确认。特斯拉的FSD软件提供完全自动驾驶能力,包括基础版辅助驾驶和增强版自动辅助驾驶的全部功能,以及未来将推出的识别交通信号灯、停车标志并做出反应,以及城市街道中的自动辅助驾驶功能。站长网2024-05-31 19:13:070000评论数达10万!Redmi K70京东好评率超98%
小米公司王腾近日在微博上盛赞RedmiK70,称其为2-3K价位中口碑和销售最好的产品之一。据他透露,该机在京东平台上的评论数已达10万,好评率高达98%以上,如此出色的销量和口碑,背后正是其全面领先的产品力。王腾强调,RedmiK70在性能、屏幕和主摄方面都表现出色,堪称同档位无敌。该机还搭载了全新的小米澎湃OS,为用户带来流畅的体验,并可尽享小米全生态智能体验。0000