元象发布 XVERSE-MoE-A4.2B 大模型 可免费商用
站长网2024-04-18 15:03:300阅
元象发布了 XVERSE-MoE-A4.2B 大模型,采用混合专家模型架构,激活参数为4.2B,效果媲美13B 模型。该模型全开源,免费商用,可用于海量中小企业、研究者和开发者,推动低成本部署。
该模型具有极致压缩和超凡性能两大优势,采用稀疏激活技术,效果超越多个业界顶流模型,并接近超大模型。元象 MoE 技术自研创新,研发高效融合算子、细粒度专家设计、负载均衡损失项等,最终采用实验4对应的架构设置。
在商业应用上,元象大模型已与多个腾讯产品进行深度合作,为文化、娱乐、旅游、金融领域提供创新用户体验。
Hugging Face:https://huggingface.co/xverse/XVERSE-MoE-A4.2B
ModelScope魔搭:https://modelscope.cn/models/xverse/XVERSE-MoE-A4.2B
Github:https://github.com/xverse-ai/XVERSE-MoE-A4.2B
0000
评论列表
共(0)条相关推荐
三星S24 Ultra真机实拍曝光:直角边设计太舒服了!
三星S24系列新旗舰手机即将于1月18日凌晨2点发布,目前已经有越来越多的新机实拍图出现在公众视野中。根据外媒报道,近日一组新的照片曝光了三星S24Ultra正面屏幕图。这些照片展示了这款金色配色和与之相配的中框设计。虽然我们没有看到手机正面的显示屏,但是从侧面角度看,可以清楚地看到全新钛合金框架所带来的强度和轻量化方面的提升。这与苹果最新旗舰手机类似。0001华为语言模型新专利公开!回复信息可自动生成水印
快科技11月8日消息,随着OpenAI的ChatGPT横空出世,越来越多的互联网大厂也开始布局AI大模型产品,其中自然会涉及到诸多版权争议。不过最近华为对一项专利进行了公开,或许能够有效避免该问题。据天眼查显示,华为技术有限公司申请的一种语言模型保护方法、装置及计算设备集群”专利公布。站长网2023-11-08 20:32:540000SpaceX再送4名“私人”宇航员上太空:将开展13项实验
快科技1月19日消息,据媒体报道,美国东部时间18日16时49分,SpaceX搭载4名航天员的公理三号”(Ax-3)龙”飞船由猎鹰九号”运载火箭从佛州肯尼迪航天中心LC-39A工位发射升空。0000英特尔发布 AI 加速器 Gaudi 3 :预计明年推出 对标英伟达H200
在今日“让AI无处不在”的活动上,英特尔CEO帕特・基辛格(PatGelsinger)还首次向公众揭示了英特尔Gaudi3系列AI加速器,这是一款专为深度学习和大规模生成人工智能模型设计的工具,计划明年推出。据英特尔表示,新一代的Gaudi3AI加速器凭借出色的性能优势和极具竞争力的总体拥有成本及定价,有望在2024年占据更大的市场份额。站长网2023-12-15 09:22:100000腾讯大模型,有啥不一样?
整个上半年,互联网大厂们轰轰烈烈地追赶AI大模型浪潮时,腾讯一直对外保持着低调姿态。就在外界以为腾讯在憋大招时,它带着行业大模型的最新动态来了。站长网2023-06-22 01:57:210000