Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC
Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。

据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍,这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。「剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中,团队在一个较小的数据集上重新训练了这个经过剪枝的模型,从而大幅提高了因剪枝导致的准确性下降。」
这些优化使得开发人员能够在「原始数据集的一小部分」上训练优化后的语言模型,从而在计算成本上节省高达 40 倍。通常情况下,AI 模型需要在模型规模和准确性之间进行权衡,但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术,语言模型可以同时兼顾这两者。
配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B,使其比云服务更快且更安全。
Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务,并针对低延迟进行了优化,以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry,将 Minitron 8B 调整为能够在低配置设备(如智能手机)上运行。尽管性能和准确性可能略有下降,但 Nvidia 表示该模型仍然是高准确性的语言模型,并且只需极少的训练数据和计算资源。
剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上,开发者可以将这些优化技术应用于所有现有的语言模型,从而显著提升整体性能,包括那些只能由 AI 加速服务器群组运行的大型语言模型。
AI这么火,百度究竟赚了多少钱?
AI时代,百度备受关注。2024年2月28日,百度发布最新财报,2023年第四季度营业收入为349.51亿元,同比增长6%,而净利润为77.55亿元,同比增长44%;2023年全年营业收入为1345.98亿元,同比增长9%,而净利润为287亿元,同比增长39%。论增速,净利润远远高于营业收入。站长网2024-02-29 17:10:190000比苹果良心!小米15、REDMI K80系列MiCare仅299元起:两年质保、免费维修
快科技12月13日消息,苹果的AppleCare服务可以在期限内享受免费维修、低价换屏等一些特权,但一年1599元的价格劝退了很多人。相比之下,很多安卓厂商推出的类似服务就便宜了很多,而且还经常有活动,相对更实用一些。站长网2024-12-13 08:46:440000谷歌搜索无法区分 AI 生成的图片和真实图片,引发对真实内容展示的担忧
在听过IsraelKamakawiwoʻole动人心弦的《SomewhereOverTheRainbow》版本后,人们可能会想看看这位体型庞大的歌手长什么样。然而,今天进行这样的搜索,你会看到的是他的AI生成版本。在另一个AI图像登顶谷歌排名榜首的例子中,网民将看到Kamakawiwoʻole的AI生成图像,他坐在海滩上,手拿吉他,疯狂地大笑。站长网2023-11-28 23:55:360000OpenAI首席执行官透露2024年ChatGPT最受欢迎的功能请求
划重点:🔍OpenAI首席执行官SamAltman在2024年列举了ChatGPT制造商最常被请求的功能,包括人工通用智能、GPT-5语言模型以及更个性化。📈文章提到了用户对OpenAI在2024年构建或修复的期望,涉及人工通用智能、GPT-5语言模型、更个性化的要求。00004个字符可致iPhone崩溃 涉及苹果iOS17、iOS18等系统
网络安全研究员Konstantin近期发现苹果iOS系统中存在一个特殊Bug:当用户在应用库搜索栏或Spotlight搜索中输入两个连续的冒号“::”时,iOS设备有可能出现崩溃。这一问题在iOS17、iOS18以及iOS18.1等多个版本的操作系统中均能被复现,且影响不仅限于iPhone,iPad设备同样受到了影响。站长网2024-08-22 13:54:030000