昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE
2024年6月3日,昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型,名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的,是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。同时,这也是全球首个支持在单台4090服务器上进行推理的开源千亿级 MoE 大模型。
Skywork-MoE 的模型权重、技术报告完全开源,可以免费商用,无需申请。模型的总参数量为146B,激活参数量为22B,共有16个 Expert,每次激活其中的2个 Expert。与其他主流模型相比,在相同的激活参数量下,Skywork-MoE 的性能接近70B 的 Dense 模型,推理成本下降了近3倍。

为了解决 MoE 模型训练困难、泛化性能差等问题,Skywork-MoE 采用了两种训练优化算法:Gating Logits 归一化操作和自适应的 Aux Loss。此外,为了高效进行大规模分布式训练,Skywork-MoE 提出了两个并行优化设计:Expert Data Parallel 和非均匀切分流水并行。
在推理方面,Skywork-MoE 是目前能够在8台4090服务器上进行推理的最大开源 MoE 模型。通过首创的非均匀 Tensor Parallel 并行推理方式,在 FP8量化下,Skywork-MoE 可以实现2200tokens/s 的吞吐。
•模型权重下载:
○https://huggingface.co/Skywork/Skywork-MoE-base
○https://huggingface.co/Skywork/Skywork-MoE-Base-FP8
•模型开源仓库:https://github.com/SkyworkAI/Skywork-MoE
•模型技术报告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf
•模型推理代码:(支持8x4090服务器上8bit 量化加载推理) https://github.com/SkyworkAI/vllm
周鸿祎内部信:鼓励所有员工拥抱GPT 拿到更好的绩效
今天下午,360集团创始人周鸿祎发布主题为“三六零人工智能总动员”的内部信,要求360每一位员工、每个产品和业务都要全面拥抱人工智能,适应人机协作,着手产品重塑。周鸿祎在信中透露,360集团将推行“揭榜挂帅”制,招募更多员工加入大语言模型的核心研发。站长网2023-04-21 16:24:410000腾讯推出新自研AI引擎:游戏研发效率提升超40倍
快科技7月30日消息,日前在ChinaJoy高峰论坛上,腾讯公司副总裁张巍表示,AI在游戏领域已经成为研发标配”。腾讯于今年推出了新的自研AI引擎,能够让游戏场景制作、内容生成等领域的部分工作效率提升40倍以上。据了解,腾讯是较早系统化布局AI研发的企业之一,从2016年成立AILab,到去年推出混元大模型,相关研究已在游戏、社交、数字人等领域广泛落地。站长网2024-07-30 16:46:420000全球最大音频流媒体公司Spotify裁员17%:遣散费约2.7亿元
快科技12月4日消息,据国内媒体报道,全球最大音频流媒体公司Spotify(声破天)周一宣布,将裁减大约17%的全球员工。这一数字约占Spotify全球9000名员工中的1500人,公司称这是经济增长大幅放缓”的结果。该公司CEO丹尼尔埃克今日表示,今天的决定不是后退”,而是战略调整”,公司预计将产生至少3500万欧元(约合人民币2.71亿元)的遣散费用。0000六种美食账号玩法,每个都有钱赚!
各位村民好,我是村长你如果问我,自媒体拍什么样的账号,最容易涨粉,最容易有播放量。我一定推荐你去做美食账号,尽管它的竞争十分激烈。但是一说到美食自媒体,大家就想到做菜,其实远不止于此。今天,我就为大家罗列六种关于美食账号的玩法,希望对你有借鉴参考意义。01美食教学号刚才说了,这是最常见的,也是竞争最激烈的。核心原因就是拍摄门槛低,不管你家啥条件,只要有手机、有口锅就可以拍摄了。0000如何把一根性价比鱼竿在抖音做成爆款
在做了十年的代工后,张永杰创立了「巧渔夫」品牌。2023年,巧渔夫发力抖音电商。凭借完整的产业链优势和性价比策略,巧渔夫推出的新品鱼竿在直播间获得成功,月销售额从最初的二十几万做到现在的六七百万。对于未来,张永杰希望将巧渔夫打造为年销售两三亿的头部渔具品牌。在巧渔夫的故事中,我们观察到一个产业带商家如何在抖音电商上用性价比的方式做爆品。一根卖爆了的鱼竿站长网2024-07-04 17:59:130001