Nvidia 和 Mistral AI 的超精确小语言模型适用于笔记本电脑和 PC
Nvidia 和 Mistral AI 发布了一款新型的小型语言模型,据称该模型在小体积下依然具有「最先进」的准确性。该模型名为 Mistral-NemMo-Minitron 8B,是 NeMo 12B 的迷你版本,参数量从 120 亿缩减到了 80 亿。
据 Nvidia 深度学习研究副总裁 Bryan Catanzaro 在博客文章中介绍,这款 80 亿参数的小型语言模型通过两种不同的 AI 优化方法实现了规模缩减。开发团队使用了结合剪枝和蒸馏的技术。「剪枝通过去除对准确性贡献最小的模型权重来缩小神经网络的规模。蒸馏过程中,团队在一个较小的数据集上重新训练了这个经过剪枝的模型,从而大幅提高了因剪枝导致的准确性下降。」
这些优化使得开发人员能够在「原始数据集的一小部分」上训练优化后的语言模型,从而在计算成本上节省高达 40 倍。通常情况下,AI 模型需要在模型规模和准确性之间进行权衡,但通过 Nvidia 和 Mistral AI 的新剪枝和蒸馏技术,语言模型可以同时兼顾这两者。
配备了这些增强功能的 Mistral-NeMo-Minitron 8B 据称在九项同类规模的语言驱动 AI 基准测试中表现出色。所节省的计算资源足以让笔记本电脑和工作站 PC 本地运行 Minitron 8B,使其比云服务更快且更安全。
Nvidia 围绕消费者级计算硬件设计了 Minitron 8B。该语言模型被封装为 Nvidia NIM 微服务,并针对低延迟进行了优化,以提高响应速度。Nvidia 通过其定制模型服务 AI Foundry,将 Minitron 8B 调整为能够在低配置设备(如智能手机)上运行。尽管性能和准确性可能略有下降,但 Nvidia 表示该模型仍然是高准确性的语言模型,并且只需极少的训练数据和计算资源。
剪枝和蒸馏技术似乎是人工智能性能优化的下一前沿。理论上,开发者可以将这些优化技术应用于所有现有的语言模型,从而显著提升整体性能,包括那些只能由 AI 加速服务器群组运行的大型语言模型。
雷军回应李想说要送车:感谢心意 还是决定买一台支持
今日,雷军在微博中表达了对李想心意的感激,但同时强调,他仍决定购买一辆理想L6Max来亲自体验并表达他对这款产品的支持。此前,雷军曾在社交平台上发布视频,对理想L6在北京车展上的表现赞不绝口。他更是设定了一个挑战,表示如果这条视频的点赞量能够超过50万,他就将购买一辆理想L6。结果,这条视频的点赞量不仅突破了50万,更是达到了70万,足见公众对雷军和理想L6的关注度之高。站长网2024-04-28 20:40:420000英特尔宣布将于 2026 年发布 Falcon Shores 2 芯片:专为人工智能和超级计算设计
站长之家(ChinaZ.com)8月9日消息:英特尔首席执行官PatGelsinger透露,该公司正在研发一款名为FalconShores2的新版本芯片,预计将于2026年发布。FalconShores2芯片将继承第一代FalconShores芯片的设计理念,专为人工智能和超级计算而设计,并将于2025年发布。这一消息是在英特尔最近的财报电话会议上公布的。站长网2023-08-09 12:12:110000Canva 收购创意软件巨头 Affinity,扩大专业设计市场版图
全球领先的视觉传播平台Canva今日宣布收购创意软件套件Affinity。这一举动将大大增强Canva打造最全面视觉通信工具的愿景。0000OpenAI暂停ChatGPT Plus用户注册 因超出服务器承受范围
今天上午,OpenAI的CEOSamAltman在社交平台上宣布,由于近期ChatGPT的使用量激增,超出公司的承受能力,因此他们决定暂停新的ChatGPTPlus账号注册,以确保每位用户都能有良好的使用体验。对此,Altman公开致歉,称新功能的使用情况远远超出预期,并且由于服务器负载的原因,出现了服务不稳定的情况。站长网2023-11-15 20:57:070000研究表明最高管理层可能低估了 AI 威胁
一项调查显示,在美国监管和执法机构越来越多地审查人工智能的有害影响之际,最高管理层对应对人工智能威胁过于自信。该研究调查了美国的500名C级高管,与ColemanParkes合作开展了这项调查。报告称,只有4%的受访者认为人工智能风险“很大”。但如果出现问题,超过一半的受访者无法逆转使用人工智能产生的结果。此外,四分之一的受访者表示,他们公司处理人工智能风险的政策没有记录或不存在。站长网2023-05-17 12:12:080000