小米发布新项目SDXS,大幅提升SD图像生成速度
站长网2024-03-27 12:54:202阅
近日,小米发布了一项名为SDXS的项目,该项目旨在大幅增强SD图像生成速度。据悉,SDXS可以在单个GPU上实现SD1.5每秒100张图的生成速度,而SDXL则能达到每秒30张图的生成速度。这一项目估计是为了在小米的本地设备上运行SD模型而研究的。
扩散模型在图像生成任务上取得了优异的性能,但由于模型庞大且需要多步采样,推理速度很慢,难以部署在低功耗设备上。为了解决这些问题,可以采用剪枝、知识蒸馏、量化等常见的模型压缩方法。本文的优化思路主要有两个方面:一是模型微型化,二是减少采样步数至1步。
项目地址:https://top.aibase.com/tool/sdxs
在项目介绍中,小米采用了知识蒸馏技术来简化U-Net架构和图像解码器。同时,他们还引入了一种创新的单步训练技术,这种技术通过特征匹配和成绩蒸馏来训练扩散模型。基于这些优化措施,小米开发了两款模型,SDXS-512和SDXS-1024。这两款模型在单个GPU上分别能达到大约每秒100帧(比SD v1.5快30倍)和每秒30帧(比SDXL快60倍)的处理速度。
此外,小米表示,这种训练方法在图像条件控制方面展现出巨大的潜力,有效地实现了图像到图像的快速转换。这一突破性的进展将有助于推动图像生成技术的发展,同时也为小米在人工智能领域的研究和应用提供了有力支持。
0002
评论列表
共(0)条相关推荐
AI视野:通义千问发布Qwen1.5;背景分割开源模型RMBG v1.4来了;OpenAI 为 DALL-E3添加新水印;苹果图片项目MGIE上线试玩
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/🤖📱💼AI应用通义千问团队发布Qwen1.5聊天模型性能大幅提升【AiBase提要】⭐模型多样性:提供6个不同规模的模型,满足各种需求站长网2024-02-07 14:33:230000抖音618好物节正式上线 跨店每满150减25
今日,抖音618好物节正式上线。活动将推出跨店每满150减25活动,并由平台出资补贴,提供不同面额的消费券,消费者叠加使用可享满300减80等优惠价格。活动期间,抖音电商继续发力货架电商,上线单品超值购、商城频道主题日、搜索彩蛋等玩法,丰富用户购物体验。站长网2023-05-31 15:48:510000AI大模型真的引领了国内的“资本盛宴”吗?是,也不是
站长网2023-07-25 22:33:300000OpenAI推出声音克隆新技术:复刻你的声音仅需15秒
快科技3月31日消息,据媒体报道,OpenAI公司最近推出了一项革命性的声音克隆技术VoiceEngine”。据悉,VoiceEngine通过文本输入和15秒的音频样本,便能生成与原始说话者声音极为相似、情感丰富且自然逼真的语音。这一技术的研发始于2022年,并已应用于公司现有的文本转语音API和ReadAloud功能中的预设语音。0000腾讯音乐发布2023年第三季度财报:营收65.7亿元 同比下滑10.8%
腾讯音乐发布了2023年第三季度财报,数据显示,该季度总营收为65.7亿元,同比下滑10.8%。净利润为12.6亿元,同比增长15.6%。站长网2023-11-14 17:48:390000