Mistral、AI2 发布新的开源 LLMs:更小,更便宜
站长之家(ChinaZ.com) 1月31日消息:Mistral AI 和 Allen 人工智能研究所今天发布了新的大型语言模型(LLM),它们声称这些模型在各自类别中属于最先进的。
Mistral 的模型被称为 Mistral Small 3,而 Allen 人工智能研究所(通常简称 Ai2)发布的则是 Tülu 3 405B。这两款模型都可以在开源许可下使用。
Mistral Small 3 包含 240 亿个参数,远少于市场上最先进的 LLM,这使得它在启用量化后足够小,可以在某些 MacBook 上运行。量化是一种调整模型的技术,旨在在降低硬件资源需求的同时,减少一些输出质量的损失。
在一次内部评估中,Mistral 将 Mistral Small 3 与 Meta Platforms Inc. 发布的开源 LLM Llama 3.3 70B Instruct 进行了对比,后者的参数量是前者的三倍多。Mistral Small 3 提供了与 Llama 3.3 70B 类似的输出质量,但响应速度显著更快。在另一项测试中,这款新模型比 OpenAI 的 GPT-4o mini 提供了更高的输出质量和更低的延迟。
开发人员通常通过创建一个基础模型来构建 LLM,然后使用多种不同的训练方法来细化其输出质量。在构建 Mistral Small 3 时,该公司开发了基础模型,但跳过了后续的细化过程。这使得用户可以根据项目需求自行微调 Mistral Small 3。
该公司预计开发人员将会把这款 LLM 应用于各种任务,特别是在需要低延迟执行外部应用程序任务的 AI 自动化工具中。该公司表示,其一些客户还在机器人技术、金融服务和制造业等行业特定用例中使用 Mistral Small 3。
「Mistral Small 3 是一款预训练和指令式模型,专为应对『80%』的生成式 AI 任务而设计——这些任务需要强大的语言能力和指令跟随性能,并且延迟非常低,」Mistral 的研究人员在博客中写道。
今天 Mistral Small 3 的发布恰逢 Ai2(一个非营利的 AI 研究机构)发布新的 LLM。Tülu 3 405B 是 Meta 去年 6 月发布的开源 Llama 3.1 405B 模型的定制版。在 Ai2 的测试中,Tülu 3 405B 在多个基准测试中超过了原始的 Llama 模型。
该研究小组使用一种它们在 11 月首次详细说明的开发流程创建了这个 LLM。该工作流结合了多种 LLM 训练方法,其中包括 Ai2 自家发明的一种方法。
该工作流的第一步是监督微调。这是一种训练方法,通过向 LLM 提供示例提示和相应的答案,帮助它学习如何响应用户查询。接下来,Ai2 使用了另一种名为 DPO 的训练技术,将 Tülu 3 405B 的输出与一组用户偏好进行对齐。
Ai2 还使用一种名为 RLVR 的内部开发的训练方法进一步优化了模型的能力。RLVR 是强化学习的一种变体,强化学习是广泛应用的 AI 训练技术。Ai2 表示,RLVR 可以使 AI 模型在解决数学问题等任务中表现得更好。
Tülu 3 405B 代表了「完全开放的后训练方法首次应用于最大开放权重模型」,Ai2 的研究人员在博客中写道。「通过这一发布,我们展示了我们在 405B 参数规模上应用后训练方法的可扩展性和有效性。」
FF推出开发者共创官招募平台 贾跃亭:FF91将征服全球著名赛道
美国智能电动出行生态系统公司FaradayFuture(FF)发布了首辆FF912.0FuturistAlliance交付仪式视频,并推出了FF开发者共创官在线招募平台。首位新车交付用户来自加州的PrivateCollectionMotors,他们也成为了FF开发者共创官,并将为FF提供共创服务。站长网2023-08-16 14:06:140000iCloud Private Relay 宕机影响全球 Apple 用户,服务中断引关注
苹果公司最新推出的iCloudPrivateRelay服务,专为iCloud用户设计,旨在通过加密流量保护用户免受在线追踪器的侵害。然而,自上周四起,该服务在全球多个主要市场遭遇宕机,包括欧洲、印度、日本和美国,影响了部分Apple用户的正常使用。站长网2024-07-27 13:31:5100003年前“吃闭门羹”的华人创业项目,2023年拿到千万美元
故事,从失败说起2020年,赵明(音译)带着自己的创业项目,一个护肤品牌Proven,登上美国ABC推出的商业竞赛节目SharkTank,希望用公司5%的股权,从5位导师那里争取到50万美元的投资。Proven在2017年成立,经过两年时间的数据收集和产品研发,在2019年正式推出。赵明透露,2019年,Proven实现了300万美元的GMV。这个成绩吸引到了导师。站长网2023-10-26 15:53:0600008月份国产网络游戏版号下发 117款游戏过审获批
国家新闻出版署最新发布了2024年8月份的国产游戏版号审批结果,在本月的审批中,共有117款国产网络游戏获得了版号,涵盖了多家知名游戏公司的力作。在这批过审的游戏中,包括了鹰角网络的《明日方舟:终末地》、网易雷火的《界外狂潮》、阿里灵犀互娱的《荒原曙光》、金山软件的《此间山海》、完美世界的游戏《让野人飞》等。0000独立开发变现周刊(第111期):AI Excel公式生成器,月收入2万美元
目录1、Opengpts:开源的基于LangChain等基础上的GPTs交互式体验代码库2、sshx:开源的web协作终端3、Tally:一个简单的表单构建器,月收入7万美元4、一个AIExcel公式生成器,月收入2万美元1、Opengpts:开源的基于LangChain等基础上的GPTs交互式体验代码库站长网2023-11-10 09:20:200001