MiniMax 稀宇科技发布万亿 MoE 模型abab 6.5
站长网2024-04-18 17:11:351阅
MiniMax 在2024年4月17日推出了 abab6.5系列模型,这是一个万亿 MoE(Mixture of Experts)模型。在 MoE 还没有成为行业共识的情况下,MiniMax 投入了大量精力研究 MoE 技术,并在今年1月发布了国内首个基于 MoE 架构的 abab6模型。经过三个月的研发,他们推出了更强大的 abab6.5模型。
abab6.5系列包含两个模型:abab6.5和 abab6.5s。abab6.5拥有万亿参数,支持200k tokens 的上下文长度;而 abab6.5s 采用了相同的训练技术和数据,但更高效,支持200k tokens 的上下文长度,并且可以在1秒内处理近3万字的文本。
在各类核心能力测试中,abab6.5开始接近世界上最领先的大语言模型,如 GPT-4、Claude-3、Gemini-1.5等。
abab6.5和 abab6.5s 将会陆续更新到 MiniMax 旗下的产品中,包括生产力产品海螺 AI 和 MiniMax 开放平台。用户可以通过这些产品来体验这些先进的语言模型。
0001
评论列表
共(0)条相关推荐
小红书电商的“第一口螃蟹”,9块9包邮真香?
内容社区起家的小红书,一直给用户的关键词标签是潮流、时尚以及精致。小红书做电商也一直希望沿袭这些标签,从董洁直播案例,到时尚行业的电商大会,小红书在尝试走出自己风格的电商之路。而从去年开始,很多看似与社区不搭的白牌、小体量商家涌入小红书,他们不是卖上千的美容仪或奢侈品,而是9块9包邮的手机壳、10元10个的发卡、4块包邮的挂件。站长网2023-05-07 09:10:200000阿里巴巴大涨超7% 马云大幅增持阿里股票
站长之家(ChinaZ.com)1月24日消息:1月23日,阿里巴巴股价在美股市场收盘时上涨7.85%,达到74.02美元。这一涨幅引发市场广泛关注。此前,有市场消息透露,阿里巴巴集团创始人马云和蔡崇信近期大幅增持了阿里巴巴的股票。阿里巴巴方面表示,马云和蔡崇信的增持行为充分体现了他们对公司前景的看好,以及对公司未来发展、管理团队和战略方向的坚定信心。站长网2024-01-24 09:59:010000开源论文查询工具DocsGPT登顶GitHub热榜 支持多种文档类型
要点:DocsGPT是一个开源论文查询工具,支持多种文档类型,包括TXT、PDF、ZIP、MD和RST,使用大型模型、Meta相似性搜索库Faiss和LangChain技术来驱动。DocsGPT提供多种模式供用户选择,包括默认的GPT-3.5模式和需要购买Pro的GPT-4模式,还有专门优化的DocsGPT-7b模型。站长网2023-10-07 14:14:530000斯坦福CMU提出新序列模型Mamba 性能优于Transformer
要点:斯坦福CMU联合团队提出的Mamba是一种新的序列模型,击败了Transformer在语言、音频和DNA序列任务上的性能,具有线性复杂度和更高的推理吞吐量。Mamba的创新之处在于选择性处理输入信息、硬件感知的状态扩展和简化的SSM架构,使得模型能够在固定状态大小下压缩上下文并自适应调整行为。站长网2023-12-05 17:14:040000华为推出大模型时代AI存储新品
日前,华为公司宣布推出新型的OceanStorA310深度学习数据湖存储系统以及FusionCubeA3000训练/推理超融合一体机产品。这两款产品均具有较高的技术含量,可在多个场景中为用户提供一站式的便捷服务,针对基础模型训练、行业模型训练以及细分场景模型训练推理等多个方面提供全面支持。站长网2023-07-17 23:38:110001