MiniMax 稀宇科技发布万亿 MoE 模型abab 6.5
站长网2024-04-18 17:11:351阅
MiniMax 在2024年4月17日推出了 abab6.5系列模型,这是一个万亿 MoE(Mixture of Experts)模型。在 MoE 还没有成为行业共识的情况下,MiniMax 投入了大量精力研究 MoE 技术,并在今年1月发布了国内首个基于 MoE 架构的 abab6模型。经过三个月的研发,他们推出了更强大的 abab6.5模型。
abab6.5系列包含两个模型:abab6.5和 abab6.5s。abab6.5拥有万亿参数,支持200k tokens 的上下文长度;而 abab6.5s 采用了相同的训练技术和数据,但更高效,支持200k tokens 的上下文长度,并且可以在1秒内处理近3万字的文本。
在各类核心能力测试中,abab6.5开始接近世界上最领先的大语言模型,如 GPT-4、Claude-3、Gemini-1.5等。
abab6.5和 abab6.5s 将会陆续更新到 MiniMax 旗下的产品中,包括生产力产品海螺 AI 和 MiniMax 开放平台。用户可以通过这些产品来体验这些先进的语言模型。
0001
评论列表
共(0)条相关推荐
中科闻歌将于6月3日推出雅意AI大模型
中科闻歌宣布,将在6月3日推出雅意AI大模型。据介绍,雅意AI大模型支持实时在线联网、自主私有化部署、企业数据领域知识、领域深度认知等特性,为企业提供大模型、数字人、领域模型应用服务。站长网2023-05-19 16:36:290000武大版ChatGPT问世:能写诗编代码 现已开启内测招募
ChatGPT在短期内迅速爆红,可以提供课程教学大纲、做作业、编程序、写论文等,深刻影响教育界,引发不少高校纷纷禁用之。而今天,武汉大学宣布武大版ChatGPT大模型开启内测招募,内测账号仅限武汉大学在校师生,总计招募名额1000名。据了解,武大版ChatGPT名叫CheeseChat(芝士”、谐音知识”),基于国家网络安全学院数据智能实验室李晨亮老师团队的Cheese预训练语言大模型。站长网2023-05-25 18:00:250000McAfee发布“Mockingbird”计划以阻止AI语音仿冒骗局
**划重点:**1.🛡️**项目介绍:**McAfee推出“Mockingbird”旨在检测使用AI生成的深度伪造技术,通过音频欺诈消费者,防范虚假新闻等骗局。2.🌐**技术创新:**该计划采用人工智能深度伪造音频检测技术,综合应用上下文、行为和类别检测模型,准确率超过90%,以应对滥用操纵音频的网络犯罪行为。0000京东集团CEO徐雷退休 CFO许冉将出任京东CEO
2023年5月11日,京东集团宣布,京东集团CFO许冉升任CEO,负责集团各业务的日常运营和协同发展,向京东集团董事会及主席刘强东先生汇报。京东集团原CEO徐雷先生因个人原因提出退休申请,经集团董事会批准,尊重并同意徐雷先生退休申请。京东物流集团CFO单甦先生升任京东集团CFO。站长网2023-05-11 18:06:440000年花费近2000亿!谷歌只做了一件事:称对用户有利
快科技10月29日消息,根据针对谷歌的联邦反垄断最新审查文件显示,在2021年谷歌支付了高达263亿美元(约合1925亿元人民币)来确保在多个平台的默认搜索引擎地位。美国司法部表示,谷歌每年向每家分销商支付数十亿美元来确保默认搜索引擎地位,还禁止分销商与谷歌的竞争对手打交道。0000