HuggingFace diffusers轻量快速推理引擎stable-fast上线
不久前,HuggingFace 的 diffusers 轻量快速推理引擎已经在GitHub上发布。这个引擎通过一系列小幅改进,已经实现了显著提高推理速度的目标,宣称每秒可达到60步,较之前的23步有了显著提升。在自然语言处理任务中,这一引擎表现出色,赢得了众多开发者的青睐。
目前,stable-fast处于测试阶段,可能存在一些问题,但它承诺为深度学习爱好者带来颠覆性的变革。

项目地址:https://github.com/chengzeyi/stable-fast
stable-fast的设计目标是优化HuggingFace Diffusers在NVIDIA GPU上的推理。它利用一组强大的技术来确保高效的性能。其中一个显著特点是CUDNN卷积融合,它能够实现卷积、偏差、加法和激活计算模式的无缝融合。这确保了您的模型运行尽可能高效。
另一个显著特点是实现了低精度和融合的GEMM。通过在计算时使用fp16精度,同时在fp16下读写,stable-fast超越了PyTorch的默认性能。该库还擅长实现NHWC和融合GroupNorm,借助OpenAI的triton,提供了高度优化的融合NHWC GroupNorm GELU操作符,消除了内存格式排列操作的需求,进一步提高了效率。

图源备注:图片由AI生成,图片授权服务商Midjourney
此外,stable-fast引入了完全跟踪模型的概念。它改进了torch.jit.trace接口,以使其更适合跟踪复杂模型。几乎可以跟踪和转换StableDiffusionPipeline的每个部分为TorchScript。它比torch.compile更稳定,CPU开销明显更低,并支持ControlNet和LoRA。
它还引入了融合多头注意力,使其与TorchScript兼容。与其他加速库相比,stable-fast的卓越速度是其独特之处,尤其在针对HuggingFace Diffusers进行优化时。此性能比较显示了其卓越的性能。作为PyTorch的极简主义插件框架,它无缝集成了现有的PyTorch功能和基础设施,同时支持各种加速和微调技术。总之,stable-fast准备为深度学习从业者的推理优化带来革命性的速度和效率。
华为FreeBuds Pro3耳机发布 搭载麒麟A2芯片算力提升50%
在今日下午的发布会上,华为发布了FreeBudsPro3。FreeBudsPro3搭载麒麟A2芯片,其算力提升了50%。它采用海尔贝克磁铁阵列高音单元11mm超磁感低音单元,支持L2HC3.0音频协议和星闪技术,可实现无损音质,包括14Hz-48kHz/24bit1.5Mbps的AudioVivid。它还拥有静谧通话2.0,高清空间音频2.0等功能。站长网2023-09-25 16:18:330000Salesforce推出Slack AI,支持未读消息摘要等功能
文章概要:1.Salesforce宣布推出SlackAI,将生成式人工智能智能系统集成到Slack中,旨在简化工作流程。2.SlackAI的首批功能包括频道回顾、会话摘要和搜索答案,有望提高工作效率。3.除AI功能外,Slack还引入了列表和更新的工作流构建器,以更好地满足企业用户的需求。站长网2023-09-07 10:44:450000小米任命栾剑为技术委员会 AI 实验室大模型团队负责人
小米集团近日发布一份内部邮件,任命栾剑为技术委员会AI实验室大模型团队的负责人,并向技术委员会副主席、AI实验室主任王斌汇报。公开资料显示,栾剑目前担任小米技术委员会AI实验室语音生成团队的负责人,之前曾担任东芝(中国)研究院研究员、微软(中国)工程院高级语音科学家、微软小冰首席语音科学家以及语音团队负责人等职位。站长网2023-04-15 15:07:400000软银集团计划出售大部分阿里巴巴持股 价格与 2014 年买入时相当
站长之家(ChinaZ.com)4月13日消息:据WSJ消息,有报道称软银集团已着手出售在阿里巴巴集团控股有限公司的大部分持股。FinancialTimes周三援引对监管文件的分析报道称,软银今年已通过预付远期合约出售了约72亿美元的阿里巴巴股票,这将使其持股比例最终降至3.8%。站长网2023-04-13 09:49:420001苹果下半年大量采用生成式人工智能 本地AI处理能力将大幅提升
所有迹象都表明,未来的苹果设备将从今年下半年开始大量利用生成式人工智能技术。尽管具体应用方式还不太确定,但业内已有诸多迹象表明,这家库比蒂诺科技巨头正在积极布局这一领域。据彭博社报道,苹果公司将在今年晚些时候发布首款人工智能应用程序,并且这些应用将能够在没有互联网连接的情况下在本地运行。这与此前从苹果招聘记录中推断出的猜测相符。站长网2024-04-23 15:12:440000