Intel研究人员提出新AI方法，更高效地在CPU上部署LLM

站长网2023-11-10 14:46:571阅

**划重点:**

- 🌐 大型语言模型（LLM）因在文本生成、语言理解和文本摘要等任务中的卓越表现而备受欢迎，但其庞大的模型参数却需要大量内存和专用硬件。

- 🧮 为了降低推断所需的计算功率，Intel的研究人员提出了一种有效的方法，支持自动的INT-4权重量化流程，可以在CPU上高效部署LLM。

- ⚙️ 他们还设计了一个特定的LLM运行时，具有高度优化的内核，加速CPU上的推断过程。

大型语言模型（LLM）因其在文本生成、语言理解和文本摘要等各种任务中的卓越性能而备受瞩目，但它们庞大的模型参数却需要大量内存和专用硬件，这使得部署这些模型变得相当具有挑战性。

为了降低推断所需的计算功率，研究人员通常采用权重量化等方法，即减少人工神经网络的权重和激活函数的精度。其中，INT8和仅权重量化是一些改进推断成本的方法。然而，这些方法通常针对CUDA进行优化，可能不适用于CPU。

Intel研究人员提出了一种有效的方法，可以在CPU上高效部署LLM。他们的方法支持自动的INT-4仅权重量化流程，即将低精度应用于模型的权重，而将激活函数的精度保持较高。此外，他们设计了一个特定的LLM运行时，具有高度优化的内核，可以加速CPU上的推断过程。

他们的权重量化流程基于Intel神经压缩器，并允许在不同的量化配方、粒度和组大小上进行调整，以生成满足准确性目标的INT4模型。然后，将模型传递给LLM运行时，这是一个专门设计用于评估量化模型性能的环境。该运行时已经设计用于在CPU上高效推断LLM。

在他们的实验中，研究人员选择了一些参数大小不同的流行LLM，范围从7B到20B。他们使用开源数据集评估了FP32和INT4模型的性能。他们观察到，在所选数据集上，量化模型的准确性几乎与FP32模型相当。此外，他们对下一个标记生成的延迟进行了比较分析，并发现LLM运行时比ggml-based解决方案性能提高了多达1.6倍。

研究论文提出了解决LLM推断在CPU上的一个最大挑战的方法。传统上，这些模型需要像GPU这样的专用硬件，这使它们对许多组织来说不可及。这篇论文提出了INT4模型量化以及专门的LLM运行时，以在CPU上高效推断LLM。

在一组流行的LLM上进行评估时，该方法表现出比ggml-based解决方案更具优势，并且在准确性上与FP32模型相当。然而，还有进一步改进的空间，研究人员计划推动在个人计算机上实现生成式人工智能，以满足对人工智能生成内容不断增长的需求。

项目网址：https://github.com/intel/intel-extension-for-transformers

Intel研究人员提出新AI方法更高效地在CPU上部署LLM

0001

评论列表

共(0)条

相关推荐

站长资讯
iPhone16出货量或达9000万部：苹果将2024年出货量提高10%
站长之家（ChinaZ.com）7月11日消息:近日，macrumors的报道揭示了苹果对其下一代iPhone16系列的雄心壮志，公司计划将2024年的出货量提升至9000万台，实现了与iPhone15系列相比10%的增长。这一增长预期源自苹果对即将引入的AppleIntelligence功能的坚定信心，该功能预期将显著提升产品的市场需求，尤其是在AI技术竞争激烈的中国市场。
站长网2024-07-11 09:29:02
0000
站长资讯
AI正在复活逝者
外公去世十年后，算法工程师用AI复活了他。和他交谈十余小时后，工程师决定删除参数，关闭程序，永远不再回来。注：图片由midjourney生成与逝者对话尽管面临争议，但利用AI复活逝者，在国外正在成为一个新兴的产业。登录ProjectDecember网站，只要填写一份问卷，提供模拟对象的姓名、年龄和爱好，外加具体记忆和事实，就能和AI模拟出的逝者对话，一切只要10美元。
站长网2023-05-26 17:30:19
0000
站长资讯
雷军：小米北京昌平智能工厂正式落成投产
小米公司今日宣布，其位于北京昌平的智能工厂已正式落成投产。这座工厂是小米历史上第一座自有大规模工厂，标志着小米智能制造的又一关键里程碑。据了解，该工厂专注于旗舰手机的生产，年产能超过千万台，将极大地提升小米手机的产能和品质。
站长网2024-02-18 15:02:05
0000
站长资讯
美国证券交易委员会担心生成式AI会加剧金融市场风险
美国证券交易委员会（SEC）对生成式人工智能对金融市场的影响表示担忧。美国SEC主席GaryGensler在一次演讲中表示，生成式人工智能可能会增加金融市场的风险，因为它可能会导致金融机构使用不准确或不相关的信息做出错误决策。
站长网2023-07-18 12:38:53
0000
同花顺宣布完成鸿蒙原生应用Beta版开发
同花顺与华为宣布，他们已经完成了同花顺鸿蒙原生应用Beta版本的开发，并计划继续推进全量版本的研发。这次合作是同花顺与华为在金融科技领域的深度合作，旨在为投资者和金融机构客户提供更智能、更安全的服务。
站长网站长资讯2023-12-08 15:32:38
0000