DeepSparse:利用稀疏性加速神经网络推理
站长网2023-10-26 12:02:070阅
DeepSparse是一种突破性的CPU推理运行时,采用了复杂的稀疏性技术,从而实现了神经网络推理的加速。稀疏性是指神经网络中存在许多连接权重为零的情况。
DeepSparse充分利用了这些零权重的连接,以跳过不必要的计算,从而有效地提高了推理速度。作为一个开源项目,DeepSparse的代码库可以在GitHub上找到。
项目地址:https://github.com/neuralmagic/deepsparse
目前,DeepSparse已经成功集成到了TensorFlow中,并成为了TensorFlow不可或缺的一个组件。
最新的DeepSparse LLM支持以稀疏内核进行加速,实现从非结构化稀疏权重中的速度提升和内存节省,同时支持8位权重和激活量化以及高效使用缓存的注意力键和值,从而减少内存移动。不仅如此,DeepSparse还支持多种计算机视觉和自然语言处理模型,包括BERT、ViT、ResNet、YOLOv5/8等等。
核心功能:
稀疏性加速: DeepSparse使用稀疏性来加速神经网络推理,从而提高性能。
LLM支持: 支持性能卓越的LLM推理,包括稀疏内核、8位权重和激活量化,以及缓存注意力键和值的高效使用。
模型优化: 与SparseML合作,DeepSparse可以进行模型修剪和量化,以优化神经网络模型。
多种模型支持: 支持多种计算机视觉和自然语言处理模型,适用于各种任务。
多层次API: 提供引擎、管道和服务器等多层次的API,以满足不同应用场景的需求。
0000
评论列表
共(0)条相关推荐
曾希望自己未来能死在火星上!马斯克:是时候把宇航员送上火星了
1969年7月16日,阿波罗11号飞船成功发射升空,这是人类历史上第一艘成功登陆月球的载人飞船。今日,SpaceXCEO马斯克发帖回复阿波罗11号登月55周年”时表示,是时候把宇航员送上火星,来让美国达到新高度了。归根结底,每个想成为太空旅行者并帮助在火星上建立新文明的人都应该有机会做到这一点。0000小米SU7交付量破万创纪录:仅用时43天
站长之家(ChinaZ.com)5月15日消息:今日上午,小米汽车迎来了激动人心的时刻,正式宣布完成了第10000辆小米SU7的交付。从4月3日开始首批交付至今,仅仅43天时间,小米SU7就跨越了这一重要的里程碑,展现了其强大的市场吸引力和高效的产能。站长网2024-05-15 10:53:320000现金流耗尽之前,OpenAI能否做出GPT-5?Altman暴露7万亿帝国野心,但投资人犹豫了
【新智元导读】OpenAI这家AI初创公司,是历史上增长最快的公司之一,但它商业模式的长期可行性,仍然存在疑问。烧光现金流之前,OpenAI能交出怎样答卷?作为一家AI初创公司,OpenAI已经荣膺史上增长最快的公司之一。不过,它的商业模型可以长期持续吗?外媒ft给出了这样一篇长文分析。被赶下台的CEO站长网2024-03-06 09:47:280000魅族MYVU AR智能眼镜发布 售价2499元起
魅族今天下午推出了全新的品牌"MYVU",目标是为用户打造一款更时尚、轻薄、易用的全天候AR智能眼镜产品。MYVU品牌此次带来了两款旗舰产品,包括MYVUDiscovery和极致轻量化AR眼镜MYVU。站长网2023-11-30 15:40:440000