傅盛发布猎户星空大模型Orion-14B 拥有140亿参数规模
站长网2024-01-23 09:49:590阅
1月21日,猎户星空在傅盛2024开年 AI 大课暨猎户星空大模型发布会上发布了猎户星空大模型(Orion-14B)。这是一款由猎户星空研发的预训练多语言大语言模型,拥有140亿参数规模,覆盖了常见语言和专业术语,并在多个第三方测试集上取得了同级别模型的最佳效果。
猎户星空大模型的特点包括:支持超长文本,最长可达320K token;在千元级显卡上推理速度达到31token/s;多语言能力优秀,尤其在日语和韩语方面表现出色;模型大小经过量化技术处理后减少70%,性能几乎无损。

为了满足企业的应用需求,猎户星空还推出了微调全家桶,包括 RAG(检索增强生成)和 Agent 两个方向的微调模型。RAG 套件可以快速整合企业自身知识库,构建定制化的应用;Agent 套件则可以根据用户问题调用最适配的工具,解决更复杂的问题。
除了推出大模型和微调模型,猎户星空还推出了聚言人力助手、聚言云资产助手和聚言创意助手等应用,帮助企业提升运营效率和决策能力。
在发布会上,傅盛还强调,企业需要的不仅仅是大模型,更需要结合业务流程解决痛点的大模型应用。猎户星空通过提供 AI 大模型咨询与服务一站式解决方案,帮助企业实现 AI 辅助决策。
猎户星空的大模型发布是其多年来不断追踪 AI 技术演进、投入巨资研发的成果之一。猎户星空拥有顶级算法科学家团队和全球20亿用户级应用经验,同时积累了大量的用户数据和 token 数据,为研发和优化模型提供了坚实的基础。
猎户星空目前正在基于 MoE 架构训练混合专家模型,下一个里程碑是百亿参数的智能模型。
开源地址:
https://github.com/OrionStarAI/Orion
https://huggingface.co/OrionStarAI
0000
评论列表
共(0)条相关推荐
文本直接生成2分钟视频,即将开源模型StreamingT2V
Picsart人工智能研究所、德克萨斯大学和SHI实验室的研究人员联合推出了StreamingT2V视频模型。通过文本就能直接生成2分钟、1分钟等不同时间,动作一致、连贯、没有卡顿的高质量视频。虽然StreamingT2V在视频质量、多元化等还无法与Sora媲美,但在高速运动方面非常优秀,这为开发长视频模型提供了技术思路。站长网2024-04-06 14:18:290000腾讯混元大模型官网上线 已通过腾讯云对外开放
腾讯自研的混元大模型在2023腾讯全球数字生态大会上正式亮相,并通过腾讯云对外开放。该模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模和超2万亿tokens的预训练语料。腾讯混元大模型已经应用于腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档等50多个腾讯业务和产品中,并取得了初步效果。站长网2023-09-07 11:56:020001摊牌了!视频号电商再下猛药!
“WXG(微信事业群)最亮眼的业务是视频号,基本上是全场(全公司)的希望。”这是腾讯公司创始人马化腾在去年12月22日内部员工大会上的发言内容,其中饱含着对视频号的期待。而最近,视频号又有了新动作,电商板块再下猛药!视频号新动作!克制的微信不克制了!许多人发现,微信官方悄悄地在视频号搜索顶部导航位置加入“商品”tab,并在搜索结果页新增视频号小店商品入口。站长网2023-08-15 21:34:340001新加坡目前还不打算监管人工智能 呼吁企业参与世界首个 AI 测试工具包「AI Verify」
新加坡采取观望态度,不打算对人工智能进行监管。新加坡资讯通信媒体发展管理局(IMDA)的可信人工智能与数据主管LeeWanSie在接受媒体采访时表示:「我们目前不打算对人工智能进行监管。」IMDA负责推广和监管新加坡的通信和媒体行业。站长网2023-06-21 16:57:540000Meta 负责领导自研人工智能芯片的高管将于月底离职
据两位知情人士透露,负责Meta公司研发人工智能芯片工作的高管AlexisBlackBjorlin将于月底离职。AlexisBlackBjorlin曾在芯片公司博通和英特尔工作多年,领导了一个团队设计一款定制芯片,能够处理多种人工智能工作,这是该公司致力于为聊天机器人和图像生成器等产品改造其庞大的数据中心的关键部分。其中一位知情人士表示,她将于月底离职,但不会立即离开公司。站长网2023-09-29 09:34:210000