魔搭社区上线Mistral AI 首个开源 MoE 模型 Mixtral8x7B
站长网2023-12-14 09:42:420阅
Mistral AI 近日发布了首个开源 MoE 模型 Mixtral8x7B,并宣布在魔搭社区上线。
Mixtral-8x7B 是一款混合专家模型(Mixtrue of Experts),由8个拥有70亿参数的专家网络组成,在能力上,Mixtral-8x7B 支持32k token 上下文长度,支持英语、法语、意大利语、德语和西班牙语,拥有优秀的代码生成能力,可微调为指令跟随模型。
该模型在 MT-Bench 评测上达到了8.3分,与 GPT3.5相当。
Mixtral-8x7B-v0.1模型:
https://www.modelscope.cn/models/AI-ModelScope/Mixtral-8x7B-v0.1/summary
Mixtral-8x7B-Instruct-v0.1模型:
https://www.modelscope.cn/models/AI-ModelScope/Mixtral-8x7B-Instruct-v0.1/summary
Mistral-7B-Instruct-v0.2新模型:
https://www.modelscope.cn/models/AI-ModelScope/Mistral-7B-Instruct-v0.2/summary
0000
评论列表
共(0)条相关推荐
Snap 与微软合作在其「My AI」聊天机器人对话中投放广告
站长之家(ChinaZ.com)9月26日消息:Snapchat与微软合作,将在其AI产品MyAI中插入广告。MyAI是今年早些时候向更广泛的Snapchat用户推出的一个AI聊天机器人。该公司五月份表示,将开始测试SponsoredLinks(赞助商链接)——这是与用户对话相关联的链接建议。图片来自Snap站长网2023-09-26 10:01:570000正面竞争ChatGPT:俄罗斯推出GigeChat人工智能
快科技4月24日消息,在本月早些时候,俄罗斯曾宣布正在研发类GPT的生成式人工智能,并已有至少3家企业开发出了大模型的原型。今天,俄罗斯联邦储蓄银行公布GigeChat,对标ChatGPT,正式加入了这场人工智能的大战”。俄罗斯联邦储蓄银行称,GigaChat最初将处于测试模式,仅限受邀请用户参与。0001“科目三”摇出海外,为何土味BGM成了华语乐坛出海的主力?
小手一甩,双脚一崴,花手扭腰摇胯摇向了海外。不管是在海底捞,还是在短视频平台,近期随处可见的便是“剑起江湖恩怨,拂袖照明月”的“科目三”Cover视频。最近,这股魔性的模仿热潮更是从国内火到海外,在大陆、台湾地区、菲律宾、欧美等地掀起“全球摇子大赛”。其中,“科目三”在韩国的传播更是尤为出圈,还成为韩国高中校庆表演曲节目,更是因此出口转内销,令“科目三”在国内持续升温,登上社交平台热搜前列。站长网2023-12-13 14:00:370000Siri Ultra:快捷命令激活iPhone上的大模型进行对话与搜索
SiriUltra是一款由大型语言模型(LLMs)支持的智能助手,它能够与iPhone上的快捷命令集成,实现包括Llama3、GPT等模型在内的对话功能。用户现在可以享受实时语音交互和联网搜索的便利。SiriUltra利用CloudflareWorkers这一无服务器平台,使其能够与任何LLM模型配合运行,而无需专门的硬件设备。这不仅提高了响应速度,也为用户提供了更大的灵活性和便捷性。站长网2024-05-11 13:19:010000ChatGPT泄露陌生男子自拍照!隐私数据被模型偷了?网友大恐慌
【新智元导读】原来,这竟然也是ChatGPT的幻觉?最近,ChatGPT响应中蹦出陌生男子照片事件,让许多网友们震惊了!事情是这样的,一名用户向ChatGPT求助——Python中的代码格式化包back该怎样使用。开始,ChatGPT的回答还很正常。谁料想,ChatGPT忽然就在响应中,发出了一张陌生男子的自拍照!而且还出现了第二次!网友们立刻陷入恐慌。站长网2023-11-08 17:54:340000