Intel研究人员提出新AI方法,更高效地在CPU上部署LLM
**划重点:**
- 🌐 大型语言模型(LLM)因在文本生成、语言理解和文本摘要等任务中的卓越表现而备受欢迎,但其庞大的模型参数却需要大量内存和专用硬件。
- 🧮 为了降低推断所需的计算功率,Intel的研究人员提出了一种有效的方法,支持自动的INT-4权重量化流程,可以在CPU上高效部署LLM。
- ⚙️ 他们还设计了一个特定的LLM运行时,具有高度优化的内核,加速CPU上的推断过程。
大型语言模型(LLM)因其在文本生成、语言理解和文本摘要等各种任务中的卓越性能而备受瞩目,但它们庞大的模型参数却需要大量内存和专用硬件,这使得部署这些模型变得相当具有挑战性。
为了降低推断所需的计算功率,研究人员通常采用权重量化等方法,即减少人工神经网络的权重和激活函数的精度。其中,INT8和仅权重量化是一些改进推断成本的方法。然而,这些方法通常针对CUDA进行优化,可能不适用于CPU。
Intel研究人员提出了一种有效的方法,可以在CPU上高效部署LLM。他们的方法支持自动的INT-4仅权重量化流程,即将低精度应用于模型的权重,而将激活函数的精度保持较高。此外,他们设计了一个特定的LLM运行时,具有高度优化的内核,可以加速CPU上的推断过程。
他们的权重量化流程基于Intel神经压缩器,并允许在不同的量化配方、粒度和组大小上进行调整,以生成满足准确性目标的INT4模型。然后,将模型传递给LLM运行时,这是一个专门设计用于评估量化模型性能的环境。该运行时已经设计用于在CPU上高效推断LLM。
在他们的实验中,研究人员选择了一些参数大小不同的流行LLM,范围从7B到20B。他们使用开源数据集评估了FP32和INT4模型的性能。他们观察到,在所选数据集上,量化模型的准确性几乎与FP32模型相当。此外,他们对下一个标记生成的延迟进行了比较分析,并发现LLM运行时比ggml-based解决方案性能提高了多达1.6倍。
研究论文提出了解决LLM推断在CPU上的一个最大挑战的方法。传统上,这些模型需要像GPU这样的专用硬件,这使它们对许多组织来说不可及。这篇论文提出了INT4模型量化以及专门的LLM运行时,以在CPU上高效推断LLM。
在一组流行的LLM上进行评估时,该方法表现出比ggml-based解决方案更具优势,并且在准确性上与FP32模型相当。然而,还有进一步改进的空间,研究人员计划推动在个人计算机上实现生成式人工智能,以满足对人工智能生成内容不断增长的需求。
项目网址:https://github.com/intel/intel-extension-for-transformers
图像识别更准确!尤洋团队研究:全新自适应计算模型AdaTape
【新智元导读】谷歌最新提出的自适应计算模型,能够提升图像识别性能。自适应计算(adaptivecomputation)是指ML统根据环境变化调整其行为的能力。传统神经网络具有固定的功能和计算能力,即用相同数量的FLOP来处理不同的输入。但具有自适应和动态计算的模型,根据输入的复杂性调节其专用于处理每个输入的计算预算。神经网络中的自适应计算之所以吸引人,有两个关键原因。站长网2023-08-24 16:31:240001旅游网站Expedia 利用人工智能挑战 Google 旅行搜索主导地位
据外媒报道,Expedia旅游网站日前宣布,将进一步整合人工智能技术,旨在让用户在其平台上进行全面的旅行搜索,摆脱对外部搜索引擎的依赖。该公司计划通过利用大数据和机器学习,根据用户的过往旅行经历,为其推荐个性化的旅行目的地,以吸引更多直接流量。0000AI日报:ChatGPT推全能型版本ChatGPT Edu;快手上线文生图产品可图;阿里宝藏项目被Novita AI开源了;Midjourney将发布V6.5版本
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、ChatGPTEdu版本来啦:支持GPT-4o、自定义GPT、数据分析站长网2024-06-01 20:32:140000全能型AI创作平台造作AI助手:公众号推文、小红书笔记通通拿下!
造作AI助手是一个内容创作平台,旨在提供更智能的创作工具,帮助用户高效地创作高质量的内容。通过人工智能技术,工作台能够自动生成各种类型的文案,包括文章创作及改写、短视频文案、小红书通用笔记、公众号推文等。体验地址:https://www.zaozuoai.com/#/sceneModel/work用户只需要提供相关要求或内容,工作台就能快速生成符合要求的文案,大大提高了工作和企业营销的效率。站长网2023-09-11 10:40:590001AI行业求职冰火“两重天”,谁在大厂“打螺丝”?
自今年3月人工智能ChatGPT火爆全网,AI行业一度备受关注。而当风口兴起,从大厂到“新一线厂”求贤若渴,不少求职者也争相涌入赛道。伴随着“金九银十”求职季的到来,AI行业的再度掀起热潮。不过,当AI方向的硬件开发、移动开发、前端开发等核心技术人员和算法研究员成为各个大厂抢夺的人才,薪酬水涨船高时,AI内容编辑、数据标记等岗位却一度被因低薪、含金量低等原因被求职者调侃为“数字劳工”。站长网2023-10-08 18:08:290000