开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了
又有新的开源模型可以用了。
从 Llama、Llama2到 Mixtral8x7B,开源模型的性能记录一直在被刷新。由于 Mistral8x7B 在大多数基准测试中都优于 Llama270B 和 GPT-3.5,因此它也被认为是一种「非常接近 GPT-4」的开源选项。
在前段时间的一篇论文中,该模型背后的公司 Mistral AI 公布了 Mixtral8x7B 的一些技术细节,并推出了 Mixtral8x7B – Instruct 聊天模型。该模型性能在人类评估基准上明显超过了 GPT-3.5Turbo、Claude-2.1、Gemini Pro 和 Llama270B 聊天模型。在 BBQ 和 BOLD 等基准中,Mixtral - Instruct 也显示出更少的偏见。
但最近,Mixtral Instruct 也被超越了。一家名叫 Nous Research 的公司宣布,他们基于 Mixtral8x7B 训练的新模型 ——Nous-Hermes-2Mixtral8x7B 在很多基准上都超过了 Mixtral Instruct,达到了 SOTA 性能。
该公司联合创始人、X 平台用户 @Teknium (e/λ) 表示,「据我所知,这是第一个击败 Mixtral Instruct 的基于 Mixtral 的模型,在我个人的测试中,它可能是最好的开源 LLM 模型!」
模型资料卡显示,该模型在超过100万个条目(主要是 GPT-4生成的数据)以及来自整个 AI 领域开放数据集的其他高质量数据上进行了训练。根据后续微调方法的不同,该模型被分为两个版本:
仅用 SFT 方法微调的 Nous Hermes2Mixtral8x7B SFT。链接:https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-SFT
用 SFT DPO 方法微调的 Nous Hermes2Mixtral8x7B DPO。链接:https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO。Mixtral Nous-Hermes2DPO Adapter 链接:https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO-adapter
至于为什么发布两个版本,@Teknium (e/λ) 给出了以下解释:
以下是模型的输出示例:
1、为数据可视化编写代码
2、写赛博朋克迷幻诗
3、根据输入文本创建提示
以下是一些性能数据:
1、GPT4All
2、AGI-Eval
3、BigBench 推理测试
在模型发布之后不久,生成式 AI 初创公司 Together AI 就宣布了其 API 对该模型的支持。Together AI 去年11月刚完成超一亿美元的 A 论融资。在 Nous Research 训练和微调 Nous Hermes2Mixtral8x7B 模型期间,Together AI 为他们提供了算力支持。
图源:https://twitter.com/togethercompute/status/1746994443482538141
Nous Research 最初是一个志愿者项目。他们最近成功完成了520万美元的种子融资轮,此轮融资由 Distributed Global 和 OSS Capital 联合领投,同时吸引了包括 Together AI 创始人兼 CEO Vipul Ved Reddy 在内的多位知名投资者的参与。Nous 计划在2024年推出一款名为 Nous-Forge 的 AI 编排工具。
从官网介绍中可以看到,他们的产品定位是:能够连接和运行程序,获取和分析客户文档,并生成合成数据供生产使用。这些专有系统可根据客户的需求进行微调,无论其业务领域如何。通过这些新颖的算法,他们希望聚合并分析数字注意力生态系统中以往非结构化的专题数据,为客户提供隐藏的市场脉搏信息。
Meta 发布多语言语音翻译模型 SeamlessM4T:可翻译多达 100 种语言、语音或文本
周二,Meta宣布推出SeamlessM4T,一种用于语音和文本翻译的多模态人工智能模型。作为一种能够处理文本和音频的神经网络,它可以执行文本到语音、语音到文本、语音到语音和文本到文本的翻译,支持「最多100种语言」,Meta表示,它的目标是帮助说不同语言的人更有效地交流。图片来自Meta站长网2023-08-23 16:26:550000三星预告 Galaxy S24 Ultra 相机配备 AI 图像堆叠和改进的 4K 变焦功能
站长之家(ChinaZ.com)10月29日消息:三星最近发布了一个视频,展示了由高通的新Snapdragon8Gen3芯片组驱动的ISOCELL200MP传感器的新功能。目前市场上还没有配备此类硬件的智能手机,因此这显然是对即将推出的GalaxyS24Ultra的预告。站长网2023-10-29 09:20:110000雷军确认小米15涨价:小米14将是最后一款3999元数字旗舰
小米CEO雷军近日在社交媒体上宣布,即将发布的小米15系列将告别之前的3999元定价,迎来价格的上涨。这一决定是在对去年所做承诺的延续,雷军曾表示小米14将是最后一款定价在3999元的小米数字旗舰手机。站长网2024-10-25 08:22:410000世纪大和解:淘宝能从微信买流量了
今年双十一到来前,阿里和腾讯先给了外界一个惊喜。近日,阿里妈妈和腾讯广告官宣合作,将实现淘宝和微信广告流量的全面直连,推出“双11超引爆”计划。简单来说,就是淘宝商家可以借助阿里妈妈的广告系统,到微信视频号、朋友圈、小程序等生态上做流量投放了。这也透露出一个信号,淘宝和微信长达十年的“封锁之战”,终于接近尾声。站长网2023-09-27 09:08:140000腾讯广告全流量通投支持投放视频号竞价广告
微信广告助手宣布,为了帮助广告主轻松实现单条广告投放到腾讯全生态,降低广告投放的人力投入、操作复杂度和管理难度,提高起量效率,腾讯广告全流量通投不断进化,将“微信视频号”纳入通投范畴。目前单条广告可以同时投放到微信视频号微信朋友圈微信公众号与小程序腾讯平台与内容媒体(含QQ浏览器、QQ、腾讯音乐及游戏、腾讯新闻、腾讯视频)优量汇等广告版位。站长网2023-06-03 13:06:070000