昆仑万维宣布开源 2 千亿稀疏大模型 Skywork-MoE
2024年6月3日,昆仑万维宣布开源了一个性能强劲的2千亿稀疏大模型,名为 Skywork-MoE。这个模型是在之前开源的 Skywork-13B 模型的基础上扩展而来的,是首个完整应用并落地 MoE Upcycling 技术的开源千亿级 MoE 大模型。同时,这也是全球首个支持在单台4090服务器上进行推理的开源千亿级 MoE 大模型。
Skywork-MoE 的模型权重、技术报告完全开源,可以免费商用,无需申请。模型的总参数量为146B,激活参数量为22B,共有16个 Expert,每次激活其中的2个 Expert。与其他主流模型相比,在相同的激活参数量下,Skywork-MoE 的性能接近70B 的 Dense 模型,推理成本下降了近3倍。
为了解决 MoE 模型训练困难、泛化性能差等问题,Skywork-MoE 采用了两种训练优化算法:Gating Logits 归一化操作和自适应的 Aux Loss。此外,为了高效进行大规模分布式训练,Skywork-MoE 提出了两个并行优化设计:Expert Data Parallel 和非均匀切分流水并行。
在推理方面,Skywork-MoE 是目前能够在8台4090服务器上进行推理的最大开源 MoE 模型。通过首创的非均匀 Tensor Parallel 并行推理方式,在 FP8量化下,Skywork-MoE 可以实现2200tokens/s 的吞吐。
•模型权重下载:
○https://huggingface.co/Skywork/Skywork-MoE-base
○https://huggingface.co/Skywork/Skywork-MoE-Base-FP8
•模型开源仓库:https://github.com/SkyworkAI/Skywork-MoE
•模型技术报告:https://github.com/SkyworkAI/Skywork-MoE/blob/main/skywork-moe-tech-report.pdf
•模型推理代码:(支持8x4090服务器上8bit 量化加载推理) https://github.com/SkyworkAI/vllm
微信:小程序隐私授权弹窗按钮延长配置至10月17日生效
微信公众平台发布公告称,为了让开发者有足够的时间进行相应的功能开发与调整,平台将对《关于小程序隐私保护指引设置的公告》进行如下调整(已配置隐私授权弹窗按钮的开发者不受影响):站长网2023-09-15 08:26:510000报道称亚马逊正在测试AI生成产品评价摘要
据最新报道,国外电商巨头亚马逊正在测试利用AI生成产品评论摘要。用户发现称,亚马逊正在测试人工智能生成的产品评论摘要,该功能正在进行A/B测试,公司尚未发布正式公告。据称,AI摘要内容显示在评论上方,在星级评分下面,并且似乎包含指向相关评论的链接。站长网2023-06-13 14:58:500000百度聊天机器人文心一言 App 上架苹果 App Store 应用商店
文心一言是由百度公司开发的聊天机器人,能够与人交互、回答问题及协作创作。文心一言被称为著名聊天机器人ChatGPT的中国版及其竞争对手。现在文心一言App已经上架苹果AppStore应用商店。文心一言此前已开放用户申请加入体验,但现仅支持百度帐号绑定电话号码的企业级用户和个人用户。2023年3月20日,百度于官方微信公布,文心一言云服务将于3月27日上线。站长网2023-07-03 16:48:020001李子柒或将复出?文化类短视频如何实现“轻舟已过万重山”
李子柒,被誉为古风美食第一人,消失两年之久,子柒不在江湖久矣,江湖却始终有她的传说。近日,有报道预测,李子柒或将复出了!10月7日,李子柒在“2023抖音美好奇妙夜”宣传片中短暂亮相,视频中不过寥寥几秒,却此时无声胜有声,网友们纷纷猜测,李子柒或许即将在抖音平台上正式复出。站长网2023-10-14 09:08:210000研究发现 52% 的 ChatGPT 编程问题回答错误
划重点:-研究人员发现,ChatGPT生成的编程问题答案中有52%是错误的。-ChatGPT的答案在语言上更正式和分析性更强,但存在信息不准确、冗长和与人类答案不一致的问题。-尽管存在严重缺陷,但许多人类程序员更偏好ChatGPT的答案。站长网2024-05-24 11:42:100000