开源模型新纪录:超越Mixtral 8x7B Instruct的模型来了
又有新的开源模型可以用了。
从 Llama、Llama2到 Mixtral8x7B,开源模型的性能记录一直在被刷新。由于 Mistral8x7B 在大多数基准测试中都优于 Llama270B 和 GPT-3.5,因此它也被认为是一种「非常接近 GPT-4」的开源选项。
在前段时间的一篇论文中,该模型背后的公司 Mistral AI 公布了 Mixtral8x7B 的一些技术细节,并推出了 Mixtral8x7B – Instruct 聊天模型。该模型性能在人类评估基准上明显超过了 GPT-3.5Turbo、Claude-2.1、Gemini Pro 和 Llama270B 聊天模型。在 BBQ 和 BOLD 等基准中,Mixtral - Instruct 也显示出更少的偏见。
但最近,Mixtral Instruct 也被超越了。一家名叫 Nous Research 的公司宣布,他们基于 Mixtral8x7B 训练的新模型 ——Nous-Hermes-2Mixtral8x7B 在很多基准上都超过了 Mixtral Instruct,达到了 SOTA 性能。

该公司联合创始人、X 平台用户 @Teknium (e/λ) 表示,「据我所知,这是第一个击败 Mixtral Instruct 的基于 Mixtral 的模型,在我个人的测试中,它可能是最好的开源 LLM 模型!」

模型资料卡显示,该模型在超过100万个条目(主要是 GPT-4生成的数据)以及来自整个 AI 领域开放数据集的其他高质量数据上进行了训练。根据后续微调方法的不同,该模型被分为两个版本:
仅用 SFT 方法微调的 Nous Hermes2Mixtral8x7B SFT。链接:https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-SFT
用 SFT DPO 方法微调的 Nous Hermes2Mixtral8x7B DPO。链接:https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO。Mixtral Nous-Hermes2DPO Adapter 链接:https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO-adapter
至于为什么发布两个版本,@Teknium (e/λ) 给出了以下解释:

以下是模型的输出示例:
1、为数据可视化编写代码

2、写赛博朋克迷幻诗

3、根据输入文本创建提示

以下是一些性能数据:
1、GPT4All

2、AGI-Eval

3、BigBench 推理测试

在模型发布之后不久,生成式 AI 初创公司 Together AI 就宣布了其 API 对该模型的支持。Together AI 去年11月刚完成超一亿美元的 A 论融资。在 Nous Research 训练和微调 Nous Hermes2Mixtral8x7B 模型期间,Together AI 为他们提供了算力支持。

图源:https://twitter.com/togethercompute/status/1746994443482538141
Nous Research 最初是一个志愿者项目。他们最近成功完成了520万美元的种子融资轮,此轮融资由 Distributed Global 和 OSS Capital 联合领投,同时吸引了包括 Together AI 创始人兼 CEO Vipul Ved Reddy 在内的多位知名投资者的参与。Nous 计划在2024年推出一款名为 Nous-Forge 的 AI 编排工具。
从官网介绍中可以看到,他们的产品定位是:能够连接和运行程序,获取和分析客户文档,并生成合成数据供生产使用。这些专有系统可根据客户的需求进行微调,无论其业务领域如何。通过这些新颖的算法,他们希望聚合并分析数字注意力生态系统中以往非结构化的专题数据,为客户提供隐藏的市场脉搏信息。
小米14 Ultra保外维修价格公布:换主板2730元
小米14Ultra旗舰影像手机现已开售,起售价6499元。小米商城最新信息显示,官方已公布该机的保外维修价格细节。令人瞩目的是,小米14Ultra的主板维修费用相当高昂,保外物料指导价高达2730元,加上40元的维修费。除主板外,显示屏的保外物料指导价也不低,为1350元。在摄像头方面,用户需支付1000元来更换广角镜头,490元更换超广角镜头,而长焦镜头的更换费用为180元。站长网2024-02-28 14:29:430000雷军最新确认!小米SU7总交付量已超15万辆:仅用时10个月
快科技1月25日消息,今日,雷军在直播中透露,小米SU7的总交付量已经超过15万辆。根据官方2024年年底公布的数据,小米SU7上市以来累计交付已突破13万辆,提前完成年度目标。要知道,小米SU7在2024年4月3日才开始交付,2024年全年实际上交付时间只有9个月的时间,到现在也不过10个月,相当月单月平均交付量在1.5万辆以上。0000当 AI 冲击自动化编程,谁将成为受益者?
整理|明明如月责编|何苗出品|《开谈》(ID:CSDNnews)在软件工程中,自动编程一直被视为圣杯。从编译器诞生时代开始,程序自动生成的目标就是将接近自然语言的高级语言翻译成低级语言,最终目标是实现根据自然语言描述的需求,自动生成程序。尽管这个问题在学术圈已经探索了五六十年,但直到近年来才取得重大进展。站长网2023-05-17 09:14:020000饿了么宣布继续举办视障用户专场免单活动 今日可最高免单39元
8月7日,饿了么将继续举办视障用户专场免单活动,为视障用户送福利。本次免单活动无需猜答案、无需抢时间、不限总名额,8月7日0:00:00-23:59:59期间使用饿了么APP在美食外卖频道内下单,当日的第1笔订单都能享受到最高39元的免单。平台将会在8月8日打款至饿了么钱包余额账户内。站长网2023-08-07 10:45:030001大模型,开始“抢人”
大模型越来越火,抢人大战愈演愈烈。在AIGC、ChatGPT的带动下,大模型概念开始被广泛讨论。2023年还未过半,就已经有包括百度、阿里、腾讯、商汤、京东、科大讯飞等多家互联网、AI公司陆续宣布对大模型展开探索。诚然,在大模型的技术和商业化进程上,国内相较于国外仍有一定差距。因此,大厂们毫不吝啬地开出百万年薪来争夺算法、深度学习等高级技术人才。站长网2023-05-16 11:16:050000