DeepSparse:利用稀疏性加速神经网络推理
站长网2023-10-26 12:02:070阅
DeepSparse是一种突破性的CPU推理运行时,采用了复杂的稀疏性技术,从而实现了神经网络推理的加速。稀疏性是指神经网络中存在许多连接权重为零的情况。
DeepSparse充分利用了这些零权重的连接,以跳过不必要的计算,从而有效地提高了推理速度。作为一个开源项目,DeepSparse的代码库可以在GitHub上找到。

项目地址:https://github.com/neuralmagic/deepsparse
目前,DeepSparse已经成功集成到了TensorFlow中,并成为了TensorFlow不可或缺的一个组件。
最新的DeepSparse LLM支持以稀疏内核进行加速,实现从非结构化稀疏权重中的速度提升和内存节省,同时支持8位权重和激活量化以及高效使用缓存的注意力键和值,从而减少内存移动。不仅如此,DeepSparse还支持多种计算机视觉和自然语言处理模型,包括BERT、ViT、ResNet、YOLOv5/8等等。
核心功能:
稀疏性加速: DeepSparse使用稀疏性来加速神经网络推理,从而提高性能。
LLM支持: 支持性能卓越的LLM推理,包括稀疏内核、8位权重和激活量化,以及缓存注意力键和值的高效使用。
模型优化: 与SparseML合作,DeepSparse可以进行模型修剪和量化,以优化神经网络模型。
多种模型支持: 支持多种计算机视觉和自然语言处理模型,适用于各种任务。
多层次API: 提供引擎、管道和服务器等多层次的API,以满足不同应用场景的需求。
0000
评论列表
共(0)条相关推荐
戴尔发布生成式AI工具 提供预训练模型
划重点:戴尔发布生成式AI工具,名为DellValidatedDesignforGenerativeAIwithNVIDIAforModelCustomization,可从数据中提取智能,避免从头构建模型。该工具提供了预训练模型,帮助用户根据需要定制和微调生成式AI模型,同时确保信息安全。站长网2023-10-16 23:51:150000微软蓝屏搞瘫全球,马斯克很生气,原因很尴尬
家人们,见证历史了。微软蓝屏(BSOD)的消息毫不夸张地登顶各大热搜、热榜,全球打工人被迫狂欢喜提1天休假。然而随着事件的发酵,导致这次全球最大IT宕机的罪魁祸首也逐渐浮出了水面。不过非常drama的是,“元凶”竟然是一家网络安全巨头,CrowdStrike。是自称能拥有检测网络威胁“最快平均时间”的那种实力选手,《财富》1000里500多家企业都是它的客户。站长网2024-07-21 18:32:480000淘宝上线国货超市 半个月成交额同比增长超5倍
最近,在国货热潮的推动下,淘宝上的上百家国货品牌在短短一周内涨粉超过百万。淘宝紧急上线了“国货超市”,其中包括了日用护肤、美妆、食品、服饰等各个品类的国货品牌。这些国货品牌在过去半个月的成交额同比增长超过5倍,受到了消费者的支持。在淘宝天猫上,国货占到了成交额的75%,年轻人对国货的支持度也不断提高。站长网2023-09-22 14:09:160000刀郎演唱会:谁说男人消费力不行的?
就在本周五(8月30日)晚上,刀郎线上演唱会打破了视频号直播记录,共有5000多万人看过该场直播!(点此回顾:刀郎破了视频号直播记录!)随着演唱会的爆火,其独家冠名方「贵州习酒·知交酒」也一夜之间名声大噪,迎来了品牌的高光时刻。见实留意到,近日的几场直播中,其视频号和抖音直播间销量在不断上涨,且分别位列不同平台「酒类」销量榜单前列。“虽然不喝酒也要冲动一把,体验一下「冲动的惩罚」!”站长网2024-09-03 15:09:570000AI时代新风口!吴恩达亲授智能体四大设计模式
【新智元导读】吴恩达认为,智能体的发展将会成为AI时代重要的力量,甚至比基础模型还要重要。工作之余,「吴老师」连发多篇博客,向大家介绍了AI智能体的四大设计模式。AI时代的风口在哪里?吴恩达认为,AIAgent将在今年推动人工智能的大规模进步。——甚至,有可能超过下一代基础模型所带来的影响。他希望所有从事人工智能工作的人,都能关注AI智能体的发展。站长网2024-04-19 14:08:170002